2018년 4월 5일 목요일

QIIME 2?

공개형 community sequencing data의 분석 도구인 Qiime(논문 링크)을 좀 공부해보려고 tutorial project GitHub에서 파일을 받은뒤 테스트 스크립트를 돌렸다. 파이어폭스로 결과 파일을 점검하는데 2018년 1월 1일부터 Qiime 2가 출시되어 이전 버전은 더 이상 서포트가 되지 않는다는 것이다.
생각해보니 Nature Methods에 논문이 나온 것이 2010년이니 대대적인 업그레이드가 이루어질 때도 되었다. 지난 며칠 동안 BioConda를 공부하면서 설치한 Qiime은 1.9.1이다. 프로그램 실행 방식과 인터페이스가 아주 크게 바뀌었다. 예전에는 그다지 파이썬 스크립트를 개별적으로 실행하는 방식이었는데, 이제는 Qiime 2 command-line interface(q2cli)에서 체계적으로 명령어를 입력하도록 바뀌었다. 즉 요즘 흔히 쓰이는 포맷인 qiime info, qiime alignment ... 을 따르게 된 것이다.


아직 BioConda 채널에는 정식으로 등록이 되질 않아서 설치방법은 약간 다르다.

wget https://data.qiime2.org/distro/core/qiime2-2018.2-py35-linux-conda.yml
conda env create -n qiime2-2018.2 --file qiime2-2018.2-py35-linux-conda.yml
# OPTIONAL CLEANUP
rm qiime2-2018.2-py35-linux-conda.yml

마침 유럽에서 열렀던 metagenome analysis workshop에서 배포한 qiime 파이프라인을 따라하면서 공부하려는 참이었는데 qiime 2가 나오고 말았으니 이를 어떻게 해야 할까? Qiime 1을 이제는 전혀 몰라도 되는 것일까? Qiime 1에서도 쓰였던 "Moving Pictures" 데이터셋(Moving pictures of the human microbiome. Genome Biol. 2011 PubMed)을 이용하는 Qiime 2 튜토리얼에는 qiime 1과 비교하여 친절하게 설명을 해 놓았으니 이를 따라서 실습하면 두 버전 간의 차이를 쉽게 이해할 수 있을 것이다. 새로운 버전에서는 fecal microbiota transplantation(FMT) study와 Atacama soil microbiome 등 새로운 실습를 이용한 설명도 제공한다.

Qiime 2에서는 sequence quality control을 위하여 DADA2와 Deblur 등을 플러그인 형태로 적용하여 사용할 수 있는 것도 특징이다.

튜토리얼을 대략 훑어본 후 qiime 2를 사용하는 것이 훨씬 낫겠다는 결론을 내렸다. 시대가 바뀌었다면 이를 따라야 하지 않겠는가.

댓글 없음: