2016년 6월 14일 화요일

metAMOS 설치로 뜨겁게 보낸 초여름

MetAMOS: a modular and open source metagenomic assembly and analysis pipeline(Treangen et al. Genome Biology 2013, 14:R2)의 논문 첫페이지 오른쪽 단 아래에서 세번째 줄에는 이 도구가 bioinformatics expertise가 없는 연구자를 위해 제공되는 push-button solution이라고 하였다.

정말?

최소한 python을 모르는 사람은 이 프로그램을 설치조차 하기가 너무 어렵다. 나 역시 python을 잘 이해하는 사람은 아니다. 대략 이 줄이 주석처리가 되었구나, 변수 선언이 잘못되었구나 하는 정도만 이해하는 수준이다. 이 방대한 프로그램이 돌아가기 위해서 미리 환경을 갖추는 일(python 2.7, gcc 4.7..)도 보통 수고가 아니었고, INSTALL.py 스크립트에 잘못 기록된 프로그램 다운로드 링크를 수정하지 않으면 설치가 완결되지 않는다. KOBIC의 도움이 아니었다면 결코 내 서버에 이것을 설치하지 못했을 것이다.

6월로 접어들면서 이제서야 첫 블로그 포스팅을 하는 것도 설치와 테스트에 눈알이 빠지도록 고생을 했기 떄문이다. 그 덕분에 아직 python으로는 스크립트 한 줄도 쓰지 못하는 실력이지만 그동안 항상 궁금했던 것 - 어떻게 python library를 설치하고 관리하는가 - 에 대해서 정말로 실용적인 지식을 쌓게 되었다.

거대 genome assembly를 하는 사람들에게는 매우 당연한 수순인지 모르겠지만, 미생물 유전체를 일루미나 방식으로 시퀀싱한 결과물을 k-mer abundance 및 다른 시각으로 보게 된 것이 나에게는 얼마나 큰 발전인지 모르겠다. 망친 de novo assembly의 가장 큰(haploid genome을 대상으로 벌어지는 어쩌면 '대부분의' 실패 경우에서) 이유는 오염때문이라는 것은 그렇게 썩 만족스럽지는 않은 결론이지만 말이다.

댓글 없음: