2019년 10월 23일 수요일

두 개의 계통수를 비교하는 tanglegram 그리기

같은 자료를 각각 다른 방법으로 처리하여 만들어낸 두 개의 계통수를 비교하기 위하여 같은 tip을 서로 연결한 그림을 tanglegram이라고 한다. 우리말로 옮기면 '엉킴그림' 또는 '엉킨그림' 정도가 될 것이다. R에서 dendextend 패키지의 tanglegram() 함수를 사용하면 원하는 그림을 그릴 수 있을 것 같은데, R을 쓰려면 이런 형태의 자료를 다루는 방법을 근본에서부터 공부해야 하니 당장 활용하기에는 매우 번거롭다. 스크립트를 별도로 만들지 않고 tanglegram을 그릴 방법이 없을까?

구글에게 물어보았다. Dendroscope라는 프로그램을 쓰면 된다고 한다. 나는 그동안 FigTreeiTOL server를 주로 사용해 왔는데, 계통수를 다루는 프로그램 목록에 하나를 더 추가하게 되었다.

https://www.ncbi.nlm.nih.gov/pubmed/22780991
 2012 Dec 1;61(6):1061-7. doi: 10.1093/sysbio/sys062. Epub 2012 Jul 10.

Dendroscope 3: an interactive tool for rooted phylogenetic trees and networks.

Author information

1
Department of Computer Science, Center for Bioinformatics (ZBIT), University of Tübingen, 72076 Tübingen, Germany. daniel.huson@uni-tuebingen.de

튀빙엔 대학교(Eberhard Karls Universität in Tübingen) 소속의 연구자가 개발한 툴이다. 튀빙엔(튀빙겐?) 대학은 초창기 메타게놈 분석 도구로 잘 알려진 MEGAN(MEtaGenome Analyzer, version 6 link)가 만들어진 곳이고, Dendrogram과 개발자가 같다(Huson DH). 튀빙엔 대학교는 1477년에 세워진 오래되고 유명한 학교로서 프리드리히 미셔가 19세기에 DNA를 처음 발견한 것도 이곳에서였다.

튀빙엔 대학교가 위치한 소도시 튀빙엔에 대한 여행 정보는 쉽게 검색이 가능하다.

튀빙겐, 독일에서 공부한다면 바로 이런 도시에서...

멋진 곳에서 멋진 연구 성과가 나오는 것이 맞을까? 매우 궁금하다.

Dendrscope를 이용하여 tanglegram을 그리는 방법은 다음의 링크에 상세히 설명되어 있다.

How to do a Dendroscope tanglegram

대장균의 유전체를 이용하여 roary에서 만든 core gene alignment 기반 트리(fasttree)와 accessory gene 기반 바이너리 트리를 비교하는 tanglegram을 그려 보았다. 이만하면 훌륭하다! Publication quality까지 이르도록 매만지려면 조금 더 기능을 알아보아야 되겠지만.


댓글 1개:

Anneli Jäätteenmäki :
블로그 관리자가 댓글을 삭제했습니다.