분류학은 생명과학의 여러 분야 중에서 매우 독특한 학문이다. 생물체의 특성(해부학적, 생화학적, 유전체학적 등)을 주의깊게 관찰하고 체계화하는 것은 일반적인 과학의 단계와 같다. 가설을 입증하기 위해 통제된 조건에서 실험을 하지는 않는다는 것(분석 실험은 많이 하지만)이 조금 다르고, 가장 심하게 다른 것은 매우 엄격한 규칙에 의존한다는 것이다. 물론 이 규칙은 새로운 지식이 발전하면서 계속 변한다.
나는 분자생물학이 국내에 맹렬하게 도입되던 시기에 공부를 하였기에 분류학에 대한 체계적인 교육을 받지 못하였다. 분자생물학·생화학은 모든 생명체를 아우르는 중심 원리에 집착한다. 반면 분류학은 거시적인 관점을 중요시하고, 동물·식물·미생물(아, 너무나 초보적이고 편견이 가득한 생명체의 분류 기준이여!)에 대해서 적용할 수 있는 방법이 천차만별이다. 현미경으로 겨우 보이는 세균에 손발이나 얼굴, 머리카락이 있는 것이 아니기 때문이다.
요즘 환경보호 이슈뿐만 아니라 각 국가가 고유하게 보유한 생물종의 전략자원화 추세에 따라 다시 분류학이 중요한 분야로 떠오르는 것 같다. 예전에는 정말 돈이 안되는 연구였다고 해도 과언이 아니니까 말이다. 어느 지역에 자생하는 어떤 식물에 혁신적인 신약 후보 물질이 있다고 하면, 그 식물을 제대로 구별해낼 수 있는 사람의 몸값이 올라갈 것이다. 학문적인 중요성이 아니라 경제적인 판단 기준에 의해서만 인정을 받으면 좀 아쉽긴 하다. 분류학 자체는 당연히 중요한 학문이다.
오늘 아침, Paenibacillus 종의 유전체 비교 분석을 하기 위한 바깥쪽 기준으로서 Bacillus amyloliquefaciens subsp. plantarum FZB42을 선택하여 그 서열 정보를 NCBI에서 찾아보았다. 이 균주는 식물체에 붙어서 사는(plant-associated bacterium을 이렇게밖에 표현하지 못하겠다) 그람 양성 세균으로서 식물의 성장을 촉진하며 항생물질로 활용할 수 있는 다양한 이차대사산물을 만들어낸다. 이미 다양한 미생물 비료 제품으로 만들어져 시판되고 있으며, 전체 유전체가 완전히 해독되어 2007년에 Nature지에 보고가 되었었다(논문 링크). 이 연구를 주도한 사람은 독일 훔볼트 대학에 근무하는 Rainer Borriss(ResearchGate)로서 현재 Bacillus와 Paenibacillus의 분류 및 comparative genomics 연구에 집중하고 있다. 연구 관심사가 나와 매우 유사하다. Bacillus는 16S rRNA gene seuqencing가 워낙 비슷해서 전통적인 방법으로 종을 구분하기가 까다롭기로 유명하다. 그래서 논문들을 추적하다보면 수시로 균주들이 이 종에서 저 종으로 옮겨다니게 만드는 제안을 많이 접하게 된다.
그런데 NCBI genome page에서 Bacillus amyloliquefaciens subsp. plantarum FZB42가 보이지 않는 것이었다. Bacillus amyloliquefaciens에 속하는 균주의 유전체 목록에 FZB42가 나타나지 않았다. 이게 도대체 어찌된 일인가? 몇년 전에 분명히 다운로드하여 잘 활용했었는데? 검색을 거듭한 결과 Bacillus velezensis로 명칭이 바뀐 것을 알 수 있었다. 그래서 이를 대신하여 B. amyloliquefaciens의 type strain인 DSM 7(free-living soil bacterium)의 유전체를 내려받아 사용하였다.
균주의 재분류 혹은 신종 보고 등에 관한 논문은 주로 International Journal of Systematics and Evolutionary Microbiology(줄여서 IJSEM이라 부른다)에 실린다. 여기에 실려서 공인을 받아야 비로소 어떤 균주의 명칭을 '공식적'으로 쓸 수 있고, 예전에 명명한 이름을 바꾸는 것도 이를 통해야 한다. 박테리아의 공인된 명칭 목록(approved list of prokaryotes)는 독일의 DSMZ나 LSPN bacterio.net에서 확인 가능하다. 공인되기 전까지는 "Bacillus gaemokensis"처럼 따옴표로 둘러쳐야 한다. 정확하게 표기하려면 이탤릭으로 표시해야 함은 물론이다. 여담이지만 요즘은 균주, 유전자, 유전자형, 표현형, 학명 등을 쓸 때 예전만큼 엄격하게 규칙을 지키지 못하는 것 같다.
FZB42가 다른 종 명칭으로 갈아타게 만든 근거가 된 논문은 2016년도에 IJSEM에 실린 다음의 논문이었다.
[1] Bacillus velezensis is not a later heterotypic synonym of Bacillus amyloliquefaciens; Bacillus methylotrophicus, Bacillus amyloliquefaciens subsp. plantarum and ‘Bacillus oryzicola’ are later heterotypic synonyms of Bacillus velezensis based on phylogenomics. (논문 링크)
분류학에 익숙하지 않은 사람(나를 포함하여)은 무슨 뜻인지 알기 어려운 제목이다. Bacillus velezensis는 B. amyloliquefaciens의 later heterotypic synomym이 아니라고 한다. 그러면 그 과거에는 later heterotypic synonym이었던 적이 있었나보다. 정말 그렇다!
[2] Bacillus velezensis is a later heterotypic synonym of Bacillus amyloliquefaciens. (2008년 논문 링크)
그리고 이 복잡한 관계를 정립하는 것으로 보이는 최근 논문이 2017년도에 나왔다. 역시 Borriss가 참여하였다.
[3] Bacillus amyloliquefaciens, Bacillus velezensis, and Bacillus siamensis Form an “Operational Group B. amyloliquefaciens” within the B. subtilis Species Complex. (논문 링크; PubMed가 아니라 PMC가 좋은 점은 논문 원문을 읽을 수 있다는 것이다)
자, 그러면 Bacillus를 둘러싼 복잡한 내력은 조금 뒤에 알아보는 것으로 하고, (later) heterotypic synonym이라는 가슴에 잘 와닿지 않는 용어를 공부해 보기로 하였다. 서울대학교 식물분류학연구실 장진석 교수님의 웹페이지에는 식물 분류와 관계된 자료를 많이 서비스하고 있다. 여기에서 용어 설명 페이지(링크)를 찾아가 보았다.
- synonym 이명. [미정의] 같은 분류군에 적용되는 복수의 학명 중 1개(이형이명, 동형이명 참고)
- homotypic synonym 동형이명(명명법상 이명). 학명이 다르지만 같은 기준표본에 근거한 학명(제14.4조); 국제동물명명규약과 국제세균명명규약(세균규약)에서는 각각 객관적 이명(objective synonym)으로 불림(제14.1조 각주)
- heterotypic synonym (taxonomic synonym) 이형이명(분류학적 이명) 같은 분류군을 나타내는 학명과는 서로 다른 기준표본에 근거한 학명(제14.4조). 국제동물명명규약과 국제세균명명규약(세균규약)에서는 각각 주관적 이명(subjective synonym)으로 불림(제14.4조 각주)
실제 조항은 조류, 균류와 식물에 대한 국제명명규약(멜버른 규약 2012 번역 링크)을 참조하면 된다. 박테리아에 관한 규약은 어디에 있을까? NCBI Bookshelf에 있다(링크).
국문으로 된 자료를 접했다고 해서 '이형이명'이 쉽게 이해되는가? 영 그렇지 못하다. 자연계에서 순수하게 분리한 박테리아 표본이 있다고 가정하자. 이를 서로 다른 연구자가 별도의 과정을 통해서 나름대로 이름을 붙인 경우 그 중 하나가 동형이명이 되는 것으로 생각된다. 그렇다면 이명이형은? 그리고 'later' 이형이명은?
가장 최근 논문인 [3]의 서론 부분을 읽어보았다. 2004년 Reva 등이 식물 혹은 토양에서 일곱가지의 B. subtilis group 균주를 분리하였다. 이들은 근권에서 잘 정착하여 자라면서(rhizosphere colonization) B. amyloliquefaciens의 표준 균주인 DSM7과는 다른 특성이 있었다. 여기에는 GB03과 FZB42가 있었다. GB03은 2014년 우리 연구그룹에서 유전체를 해독하여 짧은 보고를 한 적이 있다(링크). 새로운 종인 Bacillus velezensis는 1년 뒤인 2005년 신종으로 보고되었다(링크).
즉 FZB42는 B. amyloliquefaciens에 속하는 하나의 균주로 학계에 보고되었고 1년 뒤에 별도의 과정을 거쳐서 B. velezensis라는 종이 보고되었다는 것이다. B. amyloliquefaciens species가 제안된 것은 1943년인데, 실제로 공인된 것은 훨씬 뒤인 1987년이었다. 그런데 추후에 두 종의 type strain을 가지고 실험을 해 보니 "high DNA-DNA similarity and lack of phenotypic distinctive characteristics"에 의해서 B. velezensis를 B. amyloliquefaciens의 "later heterotypic synonym"이 되어야 한다고 주장한 것이 논문 [2]이다. B. velezensis BCRC 17467(T)와 B. amyloliquefaciens BCRC 11601(T) DNA 유사도(DDH 실험 결과)는 74%여서 다른 종으로 보기 어려웠다는 중요한 근거 중 하나가 되었다.
만약 B. amyloliquefaciens의 기준 표본(type strain과 동의어로 보아도 무방할 것이다)을 가지고 연구하던 사람이 이를 B. velezensis라고 명명했다면 아마도 homotypic synonym이라고 부르게 되지 않을까? 나는 최소한 이렇게 이해하였다.
그러면 다음의 어느 표현이 맞을까? 둘 다 맞을까, 아니면 어느 하나만 맞을까?
- Bacillus velezensis (syn. Bacillus amyloliquefaciens subsp. plantarum) (syn. Bacillus methylotrophicus) (syn. Bacillus methylotrophicus subsp. plantarum) (syn. Bacillus oryzae)
- Bacillus amyloliquefaciens (syn. Bacillus velezensis)
NCBI taxonomy 사이트에는 오직 (1)의 방식으로만 표기되어 있음을 알 수 있다(링크). 만약 (1)과 같이 표기한다면 먼저 공인된 종 명칭인 B. amyloliquefaciens가 매우 섭섭할 것이다. 그러나 아직 두 표기 형태 중 어느 것이 올바른지는 확신이 서지 않는다. 심지어 B. velezensis는 syn. B. oryzicola, 그리고 syn. B. methlotrophicus이기도 하다. 이는 논문[1]의 내용 중 하나이기도 하다.
왜 논문[1]에서는 B. velezensis가 B. amyloliquefaciens의 later heterotypic synonym이 아니라고 했을까? 저자들은 DDH 실험이 아니라 genome sequencing을 그 건거로 삼았다. B. amyloliquefaciens DSM7T에 대해서는 dDDH(digital DDH, 즉 genome sequence에 의한 계산; Genome-toGenome Distance Calculator 링크)가 55.5%에 불과한 반면, B. amyloliquefaciens (subsp. plantarum) FZB42T에 대해서는 85.8%였다. Sequencing에 의한 계산이 실제 DDH 실험을 이긴 셈이다.
어차피 B. amyloliquefaciens DSM7과 B. amyloliquefaciens (subsp. plantarum) FZB42T의 dDDH 계산수치는 56.2% 수준이었다. 이 논문으로 말미암아 B. velezensis는 B. amyloliquefaciens의 synonym을 벗어났고, 대신 B. amyloliquefaciens subsp. plantarum은 Bacillus velezensis의 later heterotypic synonym이 된 것이다. 또한 B. methylotrophicus와 'B. oryzicola' 역시 B. velezensis의 later heterotypic synonym이 되었다.
이제 논문[3]을 음미하면서 오랜만에 길게 쓴 글을 마무리하고자 한다. DSM7과 유사한 66개의 genome을 내려받아 비교한 결과(rpoB 유전자와 core genome sequence 사용) 이들은 (1) B. amyloliquefaciens, (2) B. siamensis, (3) a conspecific group(B. amyloliquefaciens subsp. platarum, B. velezensis, 그리고 B. methylotrophicus의 type strain을 전부 포함)의 세 개 그룹으로 묶을 수 있었다(근거로는 TETRA와 AAI). Monophyletic clade에 속하는 이 세 개의 그룹은 너무나 유사하여 종의 약간 상위에 존재하는 "operational group B. amyloliquefaciens"를 제안하였다. 비록 이들이 요즘 점점 중요성이 강조되고 있는 분석 기법인 ANI나 dDDH로는 한 종의 범주에 넣기에는 다소 곤란하다고 해도 말이다. 또한 이그룹은 식물과 더불어 살아가는 라이프스타일을 계쏙 발전시켜나가고 있는 중이며, 그러한 과정이 유전체에 남아있는 것이다.
댓글 없음:
댓글 쓰기