2017년 12월 6일 수요일

BLASTX보다 20,000 배나 빠른 DIAMOND?

블로그에 LS-BSR에 관한 글(링크)을 쓰면서 프로그램을 설치하고 테스트 데이터를 돌리기 위해 매뉴얼을 보는 중에 diamond라는 프로그램을 발견하였다. 다이아몬드? 이건 뭐하는 프로그램인가?

Fast and sensitive protein alignment using DIAMOND. Nature Method (2015)

어이쿠, 2015년에 나온 논문이었다. 나의 게으름을 탓하자... 저자는 독일 튀빙겐 대학(튀빙엔? University of Tübingen) 소속이다. 튀빙겐 대학교는 1477년에 설립된 대학으로서 1869년 Friedrich Miescher가 처음으로 DNA를 분리한 곳이 아닌가! 당시에는 이를 고름에서 분리한 백혈구의 핵에서 추출하였으므로 nuclein이라고 불렀다. 이것이 유전물질이라는 것은 몰랐지만, 획기적인 연구 성과가 아닐 수 없다. 생명과학의 역사에서는 매우 유명한 이야기인데, 논문화된 자료가 있어서 인용해 본다.

Friedrich Miescher and the discovery of DNA. Developmental Biology (2005)

이야기가 옆으로 많이 새고 말았다. 새로운 sequence search program이 지속적으로 나오는 것도 참으로 놀랍다. NGS로 인하여 워낙 많은 서열 조각이 생산되고 있으니 새롭고 빠른 프로그램의 개발 수요는 여전한 모양이다. 논문을 읽어보자. DIAMOND는 double index alignment of next-generation sequencing data의 약간 억지스러운 acronym이다. Double indexing이 무엇인지는 모르겠지만, 대용량의 sequence read를 단백질 reference database에 대하여 검색하는 프로그램이라 하니 shotgun metagenomic sequence read의 분석에 매우 유용할 것으로 생각된다.

DIAMOND 공식 웹사이트: http://ab.inf.uni-tuebingen.de/software/diamond/

할 일도 많은데 왜 새로운 프로그램은 계속 나오는가!

댓글 1개:

HoonJe Seong :

박사님 안녕하세요 !
얼마 전 이상준 교수님 수업때 세미나 해주신 기억이 남아서 글을 남기게 되었습니다.
사실 PhyloPythiaS+ 검색하다가 박사님 블로그가 나와서 반가운 마음에 댓글 남깁니다!
유익한 피드들이 많네요 앞으로도 좋은피드 부탁드려요