2022년 4월 27일 수요일

단어장을 정리하듯 파이썬 공부를 하다

매주 화요일 저녁에 빅데이터 분석 동영상 강의를 듣는다. 22주짜리 과정의 절반을 넘어간 상태이다. 매주 실습을 위한 자료는 쏟아지는데, 복습을 하지 않으니 실력이 잘 늘지 않는다. KNN이 어쩌고, random forest가 어쩌고... 그저 용어에만 익숙해지고 있을뿐, 내가 연구하는 분야의 실제 데이터를 투입하여 의미 있는 결과를 얻는 날은 언제나 올지 모르겠다. 올해가 마지막 기회라는 비장한 각오로 시작한 것은 좋은 일이지만.

데이터 분석 업무에 활용하겠노라고 R을 공부하기 시작한 것이 2013년. 이제는 Cookbook이나 인터넷에 돌아다니는 정보를 찾아보면서 필요한 분석을 진행할 수준은 겨우 되었다. 그러나 빅데이터 분석에서는 파이썬을 필수로 하고 있으니, 그동안 미루었던 파이썬 공부를 하지 않을 수 없게 되었다. 유전체 분석 실무에서 수도 없이 많은 종류의 파이썬 응용프로그램을 사용하고 있으면서도 설치와 실행에만 몰두했었다.

초보 수준을 갓 넘어선 R 문법에 파이썬까지 곁들이게 되니 그 혼란은 이루 말하기 어렵다. 한 언어만 알면 차라리 나을 것이라는 생각이 자주 들지만, 두 언어를 비교하면서 머릿속에 완벽한 패턴으로 자리잡도록 연습을 하면 결국 도움이 될 것이다.

예전에 참석했었던 파이썬 교육의 자료집을 오려서 휴대하기 좋은 크기로 만든 뒤 메모를 덧붙여 나가기 시작하였다. 코딩 실습은 Jupyter notebook 대신 일부러 Windows Terminal을 이용한다. Plot을 보려면 matplotlib.pyplot.show() 함수를 불러야 하는 약간의 귀찮음이 있지만, 손이 수고를 해야 더 오래 기억에 남는다는 것이 나의 지론이다.

매우 기초적인 문법 정도를 암기하기 위해 이런 방법을 택한 것이다. 예를 들어 pandas.DataFrame의 사용례를 익히려면 구글링을 하는 것이 바람직하다.

회의장에 와서 태블릿을 꺼내어 터치펜으로 메모를 하는 사람들을 보면 내가 참 구식 방식을 고수하고 있다는 생각이 든다. 세상과 나 사이에 항상 스마트한 그 무엇인가가 개입해야 한다고는 믿지 않는다. 손으로 글씨를 쓰고, 메모지를 오려 붙이고, 업무용 달력에 일정을 표시하는 구식 방법은 뇌를 더욱 건강하게 한다고 믿는다. 

'Smart'한 기기가 주변에 즐비하면, 사람은 더욱 'dumb'해진다... 



댓글 없음: