작업환경 준비 Pycharm + Colab




빅데이터 시대에 살고 있습니다. 저는 데이터관련 전공자는 아니지만 행정기관 등에서 쏟아내고 있는 다양한 정보를 찾아서 파악하고, 정리하는 일을 하다보니 자연스럽게 넘쳐나는 자료를 효율적으로 관리할 수 없을까? 하는 생각을 늘 하고 있었는데요.


그러던 중 서울대 조성준 교수님의 영상을 보게 되었습니다. 방송에서 “농사를 짓던 시절에 글공부를 등한시 했던 것이나, PC 시대 초창기에 ‘집에 꼭 PC가 있어야해?’(저도 이때쯤 사람) 그리고 스마트폰이 나오던 초창기에 ‘전화만 잘 되면 되지!’ 했던 것 처럼 지금 데이터관리에 대해 꼭 필요한지 의문을 가질 수 있지만 얼마 지나지 않아서 흔한 기술이 될 것이다”라고 말씀하신 게 아주 인상적 이었습니다.





개발 환경은 두가지를 사용합니다. 파이참 pycharm 과 구글 코랩 colab 인데요. 두가지 모두 유로서비스를 제공하고 있지만 무료 서비스 만으로 데이터분석에 필요한 거의 모든 것을 할 수 있습니다. 앞으로 더욱 폭넓은 분석을 위해서 다른 환경이 필요할 수도 있습니다.



두가지 개발환경을 사용하는 이유를 설명하기 위해 장단점을 간단하게 설명하면 다음과 같습니다.


파이참은 내 로컬 PC에 설치해서 사용하는 프로그램 입니다. 따라서 selenium 등으로 로컬에서 웹페이지를 컨트롤 하여 크롤링을 한다거나, 그 과정에서 클립보드를 사용할 필요가 있을 때 용이합니다. 반면에 로컬이 아닌 구글 서버에서 코드가 작동되는 코랩의 경우 이런 단순한 기능의 구현이 어렵습니다. 그러나 클라우드 서버에서 작동하기 때문에 로컬 PC의 리소스를 잡아먹지 않고, 특히 데이터 시각화 하는데 다양한 기능을 제공합니다.


준비하는 마음으로 첫번째 포스팅을 해 보았는데요. 앞으로 여기저기에서 건진 코드들을 공유하고 유의미한 프로젝트도 진행해 보겠습니다.

조회수 73회댓글 0개