2015년 8월 4일 화요일

생물정보 분석용 통합 소프트웨어를 쓴다는 것은...

스크류 드라이버나 플라이어, 망치 등의 범용 연장을 들고 일을 하는 것을 (Bio)Perl이나 (Bio)Python, shell script, awk(sed도 포함?)등으로 생명정보를 주무르는 것에 비유할 수 있다면, CLC Genomics Workbench나 Unipro UGENE, Geneious Pro 등 GUI 환경의 통합 분석 프로그램을 쓰는 것은 특정 용도에 딱 맞는 도구를 쓰는 것으로 비유할 수 있겠다. 예를 들자면 특정 자전거 회사의 자전거 부품 정비에만 쓸 수 있는 공구? 통합 분석 프로그램에서 다룰 수 있는 일의 범위도 요즘은 꽤 많아졌다. 그러나 문제점을 하나 제시한다면 한가지의 도구를 잘 쓴다 하여도 그러한 경험이 다른 도구를 익히는데 별로 도움이 되지 않는다는 것이다. 데이터를 다루는 방식이라든가 프로젝트 개념이 조금씩 다 달라서, 가령 내가 CLC Genomics Workbench를 아주 능숙하게 다룬다 할지라도 Unipro UGENE을 쓰려면 매뉴얼을 펼쳐놓고 처음부터 초보자의 길을 걸어가야 한다.

EUGENE을 시험 삼아서 설치해 보았다. EUGENE 내에서 blast DB를 생성하고 검색을 하는 것이 가능하다. 그런데 이미 리눅스에 익숙한 사람이라면 어떻겠는가? 차라리 NCBI BLAST+를 리눅스에 설치한 뒤 여기에서 검색을 하는 것이 더 편하다.

요즘 몇명의 초보자에게 유전체 서열 분석과 관련한 실무를 교육하는 중이다. 가장 큰 걸림돌은 바로 리눅스이다. 리눅스를 직접 설치하는 것부터 시작하는 것은 애초에 무리라서, 내가 쓰는 서버에 계정을 만들어서 사용하는 방식으로 진행을 하고 있다. command line interface와 (공포스런!) vi editor를 익히는 것은 피할 수 없는 현실이다. 여기에 더하여 EUGENE과 같은 통합 GUI 도구를 쓰도록 유도하는 것이 옳은지를 판단하기 어렵다. 나 개인적으로는 매일같이 사용하는 CLC Genomics Workbench나 artemis 말고 다른 도구를 일부러 공부하여 익숙해지려고 애쓸 이유가 하나도 없다. 하다못해 번갈아 사용하려고 구입한 Geneious Pro를 좀 써 보려고 노력을 하지만 진도가 잘 안나가고 있다.

상용 툴과 공개 툴은 각각 나름대로 쓸모가 있다. 공개 툴이라고 해서 상용 툴에 비해 반드시 기능이 떨어지거나 하는 것은 아니다. 매년 수많은 bioinformatics 공개 툴이 논문을 통해서 발표가 되지만 이 중에서 지속적으로 업데이트가 되면서 사용자 층을 확보하고 생명력을 갖추어 나가는 것은 일부에 지나지 않는다. 본 포스팅의 주제에서 벗어나는 이야기가 되겠지만, 논문으로 공개한 소프트웨어, 데이터베이스, 또는 웹 도구들은 일정 기간(최소 2년 정도) 동안에는 업데이트 및 사이트 운영이 뒷받침되어야 한다고 생각한다. 요즘 저널들은 게재되는 논문에 대해서 이러한 기준을 적용하고 있는 것으로 들었다.

이러한 GUI 통합 분석 프로그램은 분명 초보자에게는 큰 도움이 된다. 그러므로 나 자신의 분석 실무에 직접적으로 쓰일 가능성은 적다 하더라도 공을 들여 배울 필요는 여전히 있다.

Genome map과 genomic feature를 그림으로 표현해주는 프로그램 - 대개는 라이브러리 형태 - 에 대해서는 이야기가 달라진다. 내가 써 본 것은 genoPlotR 정도가 전부이다. 이 분야에서는 힘써서 공부를 할 필요성이 분명히 존재한다. 얼마 전에 이런 용도의 프로그램 또는 라이브러리를 사용해 보려고 목록을 작성해 두었는데 어디에 저장을 했는지 도무지 기억이 나지를 않는다. 자료 조사부터 다시 해야 될 것 같다.


댓글 1개:

Sang Yoon Lee :

안녕하세요..호칭을 어떻게 해야할지..정해영 박사님이신지..
다름이 아니고, 저는 분자생물학을 전공하고 생물정보학 공부를 하고 있는 이상윤 입니다. 박사학위를 받은지 1년 반 쯤 지났네요.
다름이 아니고, clc genomic workbench를 사용하여 NGS 데이터로 논문을 준비중인데, 모르는게 너무 많아 구글링을 하루에 반나절씩하다가 선생님 블로그를 보게 되었습니다. 어떻게 메일 주소도 모르겠고, 댓글만 남기게 되네요. 혹시 연구원이시라 바쁘신줄 알지만 부족한 저에게 메일 주소 하나 알려주실 수 없나요..소프트웨어를 다루고, 분석하는 방법에 대해서 죄송하지만 여쭤볼것도 있고해서요..