2020년 8월 28일 금요일

기원이 같은 미생물의 유전체 염기서열은 얼마나 차이가 날까?

(분자)생물학을 전공한 연구자라면 모든 생명체가 단일한 공통 조상으로부터 비롯되었다는 것을 애써 부정하지는 않을 것이다. 원칙적으로 모든 생명체의 족보를 거슬러 올라가면 하나의 조상을 만나게 될 것이고 긴 시간 동안 놀라운 진화 과정을 거쳐 현존하는, 그리고 지구상에서 사라진 많은 생명체를 낳았다. 하지만 오늘 쓰는 글에서 말하는 '기원이 같음'의 의미는, 수 년에서 수십 년 정도의 가까운 과거에는 동일한 (bacterial) cell stock에 보존되어 있었던 세균의 상황을 뜻한다.

상식적인 차원에서 말하자면 cell stock은 단일 콜로니의 계대 배양에서 출발한다. 즉 하나의 세포가 그 기원이라는 뜻이며, 순수성을 보장하기 위하여 여러 차례에 걸쳐 단일 콜로니를 분리했음을 의미한다. 하나의 세포에서 출발을 했다 하더라도 분열을 거듭하면서 조금씩 돌연변이가 생겨난다. 생존에 유리한 돌연변이라면 집단에 존재하는 빈도가 늘어날 것이고, 불리한 돌연변이는 도태될 것이다. 따라서 cell stock을 구성하는 세포 하나 하나에 들어있는 유전체 DNA 염기서열은 완벽하게 동일할 수는 없다. 그러나 그 변이의 폭은 상식적으로 이해할 수 있는 범위 내에 있을 것이고(실용적으로는 순수하다고 볼 수 있다), 그 균주의 고유 특성을 해치지 않을 것이다. 물론 간혹 혁신적인 변이가 생겨나서 균주 소유자에게 큰 돈을 벌어다 줄 수도 있겠지만.

대장균을 일년 내내 액체 배지가 담긴 플라스크에서 계대 배양을 하면, 1월 1일에 접종에 사용한 세포와 12월 31일에 수거한 세포에는 얼마나 많은 염기서열 차이가 존재할까? 이는 미국 미시건 주립대의 리처드 렌스키 교수에 의한 Long-term experimental evolution(LTEE) 연구로 잘 알려져 있다. 1988년 2월, 역사적인 첫 배양을 시작하여 미생물의 진화에 대한 대단한 분량의 지식을 축적하였고, 지금까지 발표된 논문과 이 방법을 활용하기 시작한 다른 연구자들의 수도 많아지면서 하나의 확고한 분야로 자리를 잡았다. 하필이면 이 실험에서 사용한 균주는 대장균 B 계열이었고, 내가 근무하는 생명연(KRIBB)의 연구 주제와 잘 부합하여 공동연구를 하게 되었다. 이때 만들어진 ScienceJournal of Molecular Biology의 2009년도 논문 두 편은 내 생애 연구 업적 중 가장 중요한 것이라고 해도 과언이 아니다. 이러한 좋은 학문적 인연을 만들어 주신 모든 분들께 지금도 감사하는 마음을 갖고 있다. 그리고 이때 대장균의 K-12와 B를 모델로 하여 균주(strain) 사이의 유전체 차이에 대한 확실한 인식을 갖게 되어 지금도 연구 업무에 중요하게 활용하고 있음은 물론이다.

출처: PLoS Biology
배양기를 가득 메운 50 ml 삼각 플라스크를 나는 2006년에 하바드 대학(Department of Organismic and Evolutionary Biology)의 Chris Marx 연구실에서 처음 보았다. 뚜껑을 대신하여 씌운 비커는 우리가 흔히 보는 연구실의 풍경(보통은 '면전'이라 불리는 솜마개를 사용)과는 달라서 요란하게 덜그럭거리는 모습이 매우 기괴하게 보였었다. 그는 리처드 렌스키의 연구실에서 박사후 연구원을 한 일이 있었고, 지금은 검색을 해 보니 아이다호 대학으로 옮겼다고 한다(링크). Marx의 지도로 학위를 받은 대만인 David Chou(국립타이완대학 교수, 웹사이트)와 나는 가끔 점심을 같이 먹기도 했었다. 벌써 오래 전의 일이다.

이야기가 옆길로 많이 샜다. 렌스키의 연구에 의하면 1년 내내 배양을 해도 원균주와 그렇게 심각할 차이가 날 정도로 돌연변이가 많이 생기지 않는다. 고작 2.43개에 불과하다. 물론 이는 1월 1일에 접종을 개시한 원균주(단일 콜로니에서 유래한, 유전적으로 균일한)와 비교했을 때 그렇다는 것이다. 12월 31일에 배양체에서 여러 콜로니(즉, 사촌들)를 수거하여 이를 서로 비교했을때는 이보다 더 많은 차이가 날 것이다.

이 수치는 다른 미생물종에 대해서도 보편적으로 적용할 수 있을 정도로 매우 유니버설한 값인데, 그 논문 PDF를 어디다 뒀는지 도무지 못찾겠다. NGS가 등장하기 이전의 논문으로 이미 어느 정도의 수치가 알려져 있었는데 아마 Ochman, Elwyn과 Moran의 1999년 PNAS 논문인 Calibrating bacterial evolution이 아닐까 한다.

여러 동료 연구자와 협업을 하면서 나는 LTEE 방법을 응용한 실험에서 비롯된 유전체 시퀀싱 데이터를 숱하게 다루어 왔다. 이미 GenBank에 유전체 정보가 등록된 균주를 다른 경로로 입수하여 시퀀싱하여 그 차이를 살펴보기도 했고, 전후관계가 명확하게 알려져 있는 균주의 유전체를 비교해 보기도 했다. Mutator, 즉 mismatch repair를 담당하는 유전자에 변이가 생겨서 돌연변이를 더 많이 만드는 '돌연변이체'로 바뀌지 않는 이상, 적으면 10개 미만, 많으면 50개 정도의 차이를 관찰하게 된다. 원본 균주와 갈라선 기간은 짧게는 수 개월(LTEE 실험), 길게는 10여년 혹은 그 이상에 해당한다. 절대적인 기준이라는 것을 제시하기는 곤란하지만, 이에 대한 나름대로의 확고한 느낌이 있는 것이다.

지금까지 기술한 것은 선후관계가 명확한 한 집안의 미생물에서 유전체 염기서열이 얼마나 달라지는지에 관한 것이었다. 그러면 역으로 유전체 염기서열의 차이를 이용하여 두 균주의 관계를 알아내는 일은 얼마나 신뢰할 수 있는가? 요즘 많은 종류의 genomic epidemiology 연구가 이루어지고 있다. 가장 시급하게는 COVID-19가 있고, 항생제 내성 균주의 병원내 감염 등 병원체가 어떤 방식으로 환자 간에 전파되었는지를 추정하기 위해 유전체 시퀀싱이라는 방법을 택한다. 시퀀싱 데이터에서는 계통수(phylogenetic tree) 자료가 얻어진다. Phylogentic tree = transmission tree는 아니지만, 이로부터 우리는 상당히 많은 정보를 얻을 수 있다.

균혈증(bactermia)이라는 증세가 있다. 혈액에서 세균이 검출되는 현상을 말한다. 혈액 속에서 세균이 증식하여 대단히 위험한 전신적 증세 - 발열, 빠른 맥박, 호흡수 증가, 백혈구 수 증가 또는 감소 등 전신에 걸친 염증 반응 - 를 일으키는 패혈증(sepsis)과는 다르지만, 위험성을 나타내는 중요한 신호라 할 수 있다. 락토바실러스 람노서스(Lactobacillus rhamnosus)라는 프로바이오틱을 섭취한 중환자에게서 같은 미생물에 의한 균혈증이 발견되었다고 한다. 혈액 속의 락토바실러스 람노서스가 바로 그 환자가 먹었던 프로바이오틱스 제품에서 유래한 것인지를 어떻게 판단할 것인가? 방법은 유전체 해독뿐이다. 2019년 Nature Medicine에 실렸던 논문(Genomic and epidemiological evidence of bacterial transmission from probiotic capsule to blood in ICU patients. NATURE MEDICINE | VOL 25 | NOVEMBER 2019 | 1728–1732)가 바로 그 논문이다. 세 명의 교신저자중 하나인 Roy Kishony는 4 x 2 피트 크기의 Mega-Plate에서 항생제 내성 박테리아의 발생과 성장 및 종말을 멋지게 보여줬던 바로 그 장본인이다. 미생물학 또는 유전체학의 실제 실험 데이터를 이렇게 현란한 비주얼로 보여준 사례는 많지 않다. 물론 열흘이 넘는 오랜 시간에 걸쳐 촬영한 뒤 재생 시간을 크게 단축했기에 가능한 일이다.


LGG(Lactobacillus rhamnosus GG - 국내에서도 제품으로 팔리는 전세계적으로 가장 유명한 프로바이오틱균)을 섭취한 522명의 중환자실 환자 중 6명이 이 세균에 대한 균혈증이 나타났다. 이를 상당히 높은 비율이라 생각하는 근거는 무엇인가? 프로바이오틱을 먹지 않은 환자 21,652명 중에는 겨우 2명이 그러했기 때문이다. 통계적 계산을 해 보지 않아도 명확한 연관관계가 있음을 어렵지 않게 생각할 수 있다. 중환자실에 있는 환자이니 프로바이오틱 알약이나 가루약을 물과 함께 들이킬 수는 없었을 터이고, 논문에 의하면 관을 통해서 투여했다고 한다.

6명의 환자의 혈액에서 분리한 세균과 실제 프로바이오틱 제품에 포함된 균주(제품 자체에 대한 deep sequencing 및 제품에서 분리한 복수의 균주에 대한 시퀀싱 포함)는 유전체 해독을 하여 참조 유전체 서열(FM179322)에 매핑하여 비교하였다. 샘플에서 확인된 모든 SNP는 다 끌어모아도 23개 염기에 지나지 않았다. 그리고 분리된 균주는 공통 조상과 비교했을 때 최대 6 SNP를 넘는 차이가 나지 않았다.

이상의 데이터를 가지고 환자의 혈액에서 분리된 락토바실러스 람노서스가 프로바이오틱 제품으로서 섭취한 락토바실러스 람노서스에서 비롯된 것임을 증명하는 것이 부족할까? 표현형을 관찰할 수 있는 실험을 실시하여 그것까지 동일함을 밝혀 곁들여야 비로소 증명이 될까? 아니면 세상에 존재하는 LGG가 아닌 다른 락토바실러스 람노서스 균주를 구한 다음 유전체 시퀀싱을 해서 환자의 혈액에서 검출된 것과 유사한 것이 없음을 일일이 밝혀야 증명이 될까? 나는 그렇게 생각하지 않는다.

미생물의 독소를 이용한 미용성형용 제품을 만드는 두 바이오제약기업의 싸움이 이제 중반전을 넘어가고 있다. 이 사건을 둘러싼 여러 시각이 존재함을 잘 안다. 주식 투자자를 비롯한 이해 당사자의 관계까지 복잡하게 얽혀 있어서 인터넷에 하루가 멀다 하고 쏟아져 나오는 기사, 홍보자료, 댓글 등을 보아서는 쉽게 판단이 가지 않는다. 법리적 공방은 내가 뭐라 할 수 있는 전문 분야가 아니니 논외로 하더라도, 유전체 해독 결과물을 이용한 과학적 결론은 재론의 여지가 없다고 생각한다.

지난 세기 초반에 미국에서 발견되어 수십 년 동안 연구실과 최근에는 공장에서 쓰인 균주와, 국내 환경에서 약 10년 전에 분리된 균주의 유전체가 10여개 SNP 말고는 다른 것이 없음을 과학적으로 설명하는 가장 합리적인 방법은 무엇이 있을까? 두 균주가 각각의 지역에서 고유하게 존재해 왔다면 10여 개 SNP 말고 좀 더 근본적인 차이가 있어야 한다. 가령 prophage가 하나 더 박혀 있다거나, 수십 kb 정도가 사라졌거나, 특정 부분에서 rearrangement가 일어났다거나 하는 등의 차이가 있어야 한다. 미국 토양에 있던 균주가 동물의 이동이나 바람에 실려서 한국까지 왔을까? 혹은 수출입 물자에 묻어있던 흙에 포자가 섞여서? 그 가능성은 천문학적 숫자 분의 1이 될 것이다.

가장 합리적인 설명은, '두 균주가 최근까지 한 cell stock에 있었다'가 될 것이다. 이를 증명하기 위해 다른 대조군을 넣을 필요도 없다. 그것이 실제 연구 현장에서 미생물 유전체 시퀀싱 데이터를 나름대로 많이 만져 본 나의 의견이다.

댓글 없음: