2015년 3월 16일 월요일

Geneious R8 기능 익히기

Geneious는 분자생물학자를 위한 GUI 기반의 서열 분석 프로그램이다. CLC Genomics Workbech에서 다루어지지 않는 기능을 보충하고자 2년 전에 구입했었다. 당시에는 genome 수준의 alignment 기능만 조금 활용했었는데, 올해 발표된 R8에는 유용한 기능들이 많이 눈에 뜨여서 업데이트를 하였다. 외부 프로그램을 플러그인 형태로 지원한다는 것도 CLC Genomics Workbench와 유사하다. Blast2GO (PRO)플러그인은 오직 CLC Genomics Workbench와 Geneious에만 있다. 일주일짜리 free trial만 제공하니 제대로 쓰려면 정식으로 라이센스를 구입하는 것이 좋을듯.

Geneious의 공식 매뉴얼은 여기에 있다(온라인 혹은 다운로드). 튜토리얼은 zip 파일을 다운로드하여 압축을 풀지 말고 임포트를 하면 된다. 튜토리얼을 직접 만들어서 올릴 수도 있다.

Blast2GO PRO에 가입하면 CloudBlast를 쓸 수 있다. CloudBlast란 대용량 BLAST 작업을 할 수 있도록 제공되는 클라우드 기반의 community resource이다. 꽤 빠른 편이다.



새로운 GUI tool에 익숙해지려면 사용자의 데이터가 프로그램에서 어떻게 취급되는지를 아는 것이 중요하다. 예를 들어 Geneious에서는 genome assembly 결과물과 같은 multiple FASTA file을 임포트하면 이대로는 선택을 할 수 없고, 반드시 Sequence -> Extract Sequences from List...로 처리해야 한다.

지금은 Geneious에서 glimmer로 ORF를 예측한 다음 일괄적으로 번역하여 blast2go와 interproscan을 실시하는 중이다... 으헉, Blast2GO Pro free trial이 만료되어서 결과가 다 사라져 버렸네... CLC Genomics Workbench에서는 염기서열에서 ORF 혹은 CDS feature를 일괄 translation하는 기능이 있는가? 물론 여기에 있다.

다음으로는 NGS de novo assembly를 해 보자. 박테리아용 paired end data 한 조를 불러들이고 assembly를 실행시키니 메모리가 부족하다면서 진행을 안한다. CLC는 어떻게 해서든 융통성을 발휘하는데 Geneious는 그렇지를 못하다. Tools -> Preference -> General 탭에서 사용 가능한 최대 메모리가 겨우 1000 MB로 되어 있어서 이를 왕창 늘려 보았다(수퍼유저 권한 필요).

할당된 메모리를 늘리고 다시 Geneious를 시동한다. De novo assembly에서 사용할 데이터를 %로 조절할 수 있다. Assembler는 MIRA, Velvet, CAP3, 그리고 Geneious가 준비되어 있다. 넷 중에서 Geneious로 설정하고 일루미나(101x2) 데이터 약 5천만 read를 시험삼아 돌려보는 중인데 트리밍 작업에서조차 시간이 많이 걸린다. 트리밍을 끝내고 가까스로 다음 단계로 접어들었지만 같은 컴퓨터에서 CLC Genomics Workbench로 돌리는 것과 비교하면 이건 뭐... 오늘 중에 끝나긴 틀렸다(실제로 대장균 assembly하는데 15시간 소요). 이런 속도라면 일반적인 NGS 자료 처리에 쓰기에는 부족하다. 물론 CLC Genomics Workbench와는 가격 면에서 비교하기가 어려운 툴이니 이해하도록 하자. Read mapping에서는 Geneious의 것이 우수하다는 whitepaper가 있으니 참고할 일이다.

아직 모든 기능을 경험하지는 않았지만, 일단은 Blast2GO 실행이나 graphical report를 작성하는 가벼운 용도로 활용해 보자.

[2015년 3월 17일 추가 작성] 어제 15시간이나 걸렸던 대장균 데이터를 K-12 MG1655에 매핑하는 테스트를 진행 중이다. mapper는 bowtie(v1 & 2), tophat, 그리고 Geneious 자체. 이번에는 상식적인 시간 안에 끝날 것으로 생각된다. whitepaper에서 자랑(?)을 했던 Geneious 자체 매퍼를 돌리고 있다.

댓글 없음: