2016년 1월 19일 화요일

PubMLST를 처음 접하다

미생물의 분류와 계통발생학적 분석처럼 생명정보학의 발전의 큰 수혜자가 된 '전통' 과학도 흔지 않을 것이다. Genomics 등은 아예 생명정보학과 그 태동을 같이 하였다 해도 과언이 아니니 이를 수혜자로 볼 수는 없겠다.

본론에 들어가기 전에 중요한 낱말부터 정리를 하자. 이 사이트를 참고하였음을 밝힌다.

  • Systematics(분류학) is about finding the ancestral relationship between organisms (evolutionary relationships)
  • Taxonomy(이것도 분류학?) is framing rules and regulation to put an organism into convenient taxa or groups (classifying and naming organisms)
  • Phylogeny(계통학) is a theory about how organisms are related to one another by evolutionary time (참고 사이트)

Species 수준으로 동정하기가 매우 어려운 Bacillus cereus 그룹(흔히 Bacillus cereus sensu lato라고 함)을 다룰 일이 있어서 웹 검색을 하다가 PubMLST라는 사이트를 찾게 되었다.

PubMLST - Public databases for molecular typing and microbial genome diversity

B. cereus database에는 7개의 유전자로 구성된 총 1130개의 프로파일이 수록되어 있으며, 전체 균주의 수는 1800개를 조금 넘는다. 약 이틀동안 사이트를 둘러본 것만으로 그 특성을 전부 파악했다고 자신할 수는 없지만, MLST 분석에 필요한 균주 분리 정보와 서열 획득 작업을 하기 위해서 이곳저곳의 데이터베이스를 뒤지면서 편집작업을 할 필요가 없다. 이 사이트를 진작에 알았더라면 2년쯤 전에 Vibrio vulnificus 유전체 서열을 가지고 같은 작업을 할 때 훨씬 편하게 일을 하였었을 것이다.

메인 데이터베이스를 활용하는 데에는 약간의 요령이 필요하다. Sequence and profile definition 영역과 Isolates 영역에서 다루어지는 정보가 약간 다르기 때문이다.

각종 분리 균주의 유전체와 서열 데이터를 종합 관리하기 위한 도구로서 BIGSdb(Bacterial Isolate Genome Sequence Database, BMC Bioinformatics 11:595)를 제공하기도 한다.

B. cereus 데이터베이스를 예로 들어보자. MLST 분석에 사용할 각 locus의 증폭에 사용되는 프라이머 서열은 다음 URL에 있다.

http://pubmlst.org/bcereus/info/primers.shtml

처음에는 여기에서 프라이머 서열을 받아다가 sample contig sequence에서 증폭되는 영역을 찾아내었었다(EMBOSS package의 primersearch 사용). 그런데 본 사이트가 제공하는 검색 기능을 사용하면 간단하다. 그저 유전체 서열 파일을 올리면 되는 것이었다. 그러면 업로드한 파일(multi-FASTA)의 어느 서열, 어느 위치에 해당되는 유전자가 있고 각 locus에 대해서 DB에 수록된 allele 번호가 나온다. 그러면 allele 번호를 이용하여 DB에서 서열을 뽑아내면 된다. 내 샘플 서열에서 coordinate를 이용하여 끊어낼 필요가 없는 것이다. 물론 DB에 존재하지 않는 allele로 판명되는 경우도 있다. 이때에는 약간의 수고가 따르지만.

다음은 실제 PubMLST를 사용하여 얻은 분석 사례이다. 검색을 통해 샘플 균주의 7개 유전자에 대한 allele 번호를 확인한 다음, 이것과 최소한 두 locus 이상 동일한 것들의 정보를 뽑은 것이다. 후속 작업으로서 phylogenetic tree를 그리기 위한 concatenated sequence 추출은 클릭 한번으로 이루어진다.



이렇게 공개된 서비스를 이용하여 정말 편리하게 분석 작업을 마치게 되었다. 정말로 고맙지 아니한가!

댓글 없음: