아주 초보적인 수준의 microarray data, 그리고 RNA-seq data를 다루기 위해 R을 공부하고 있다. 인터넷에서 초보용 가이드를 처음 내려받아 인쇄하여 보기 시작한 것이 2011년이었고, 작년부터는 하루 이틀 정도의 단기 강좌를 시간이 나는대로 열심히 들었다.
실제로 내 데이터를 가지고 몰두 한 총 시간은 그렇게 많지 않다. 단지 요즘 몇 주 동안 집중해서 들여다보고 있노라니 어려움이 점차 해소되는 느낌이 들기 시작하였고, R 특유의 매력에 빠져들게 되었다. 특히 merge와 apply 계열의 함수의 막강한 위력을 체험하고 있다.
쓸 줄 아는 언어는 인간의 언어 이외에는 Perl이 유일한데, 올해로 거의 13년째 Perl을 쓰고 있지만 수준은 여전히 그 바닥을 넘지 못하고 있다. Perl과 R은 물론 많은 면에서 다르고 서로 보충적인 성격이 강하다.
[, -1]
이 얼마나 아름다운 데이터 조작법인가! for loop를 쓰지 않기 위해 노력하는 것, 그것이 바로 "R style"이다. 좀 더 복잡한 논리적인 계산이나 데이터 조작, 그리고 텍스트 처리에서는 Perl을 따라갈 언어가 없다고 해도 과언이 아닐 것이다. 그러나 일단 행렬 형태로 데이터를 전환시켜 놓으면 R이 힘을 발휘한다. 게다가 더욱 멋진 것은 publication-ready 수준의 다양한 그림을 그려 준다는 것. 내장되어 있는 통계 분석 기능은 또 어떠한가?
배움에는 나이가 없다. 열심히 공부하세...
댓글 없음:
댓글 쓰기