지난번 대장균 HB101 (re)sequencing에 이어, 이번에도 대장균 실험 균주의 resequencing을 하게 되었다. Plasmid transformant이긴 하지만 결과적으로는 K-12 W3110을 resequencing한 셈이 되었다. 역시 예상했던 바와 같이 NCBI에서 받은 reference sequence와 차이가 있음을 발견할 수 있었는데, 의외로 large scale 변이가 두 곳에서 관찰되었다.
보통 돌연변이라 하면 염기 서열이 시간이 지남에 따라 하나씩 치환되어 단백질의 변이까지 이어지는 점진적인 변이가 많을 것으로 생각한다. 내가 2009년 대장균 B strain의 참조 유전체 서열 작성과 Richard E. Renski의 그 유명한 실험진화균주 프로젝트에 잠시 관여하기 직전까지도 그런 생각을 갖고 있었다. 그러나 실제 뚜껑을 열어보니 그렇지 않았다. mobile genetic element나 다른 균주로부터 수평적 전달로 도입된 영역에 의한 '급진적'인 변이가 더욱 중요하게 느껴졌기 때문이다. 실험자에게 귀찮은 존재라고만 여겨지는 Insertion Sequence(IS)의 무게감을 느낀 것도 이때이다. 어쩌면 IS야말로 진화의 숨겨진 원동력인지도 모른다.
원시 유전체 프로젝트의 시절에는 각 모델 생명체의 참조 유전체를 확보하면 목표를 달성하는 것으로 보았다. 그러나 이제는 그렇지 않다. 개인별 유전체의 차이로부터 질환 감수성이나 약물 반응성 등을 예측하려는 유전체 의학의 시대가 되어 이제 시퀀싱은 모든 개체로 확대해야 하는 사업이 되었다.
대장균이나 고초균과 같은 세균으로 실험을 하는 경우도 예외는 아니다. 참조 서열이 NCBI에 등록되어 있고, 신뢰도 높은 균주 스톡 센터에서 분양을 받았다 해도 안심하지 말라. 어차피 5 Mb 정도 박테리아 유전체를 일루미나로 읽어서 참조 서열 존재 하에 완벽하게 재구성하는 것은 그렇게 어렵지 않은 시대가 되었다(실제로는 손이 꽤 많이 간다. 재수가 없으면 손에 물을 묻히는 실험을 피하지 못한다...). 모름지기 실험 균주라면 한번씩은 완벽하게 유전체 서열을 읽어서 미처 모르는 부분에서 기대하지 못한 실패가 나타나지 않도록 대비하는 것이 좋을 것이다.
그래서 나는 오늘도 CLC Genomics Workbench와 Consed에게 감사하는 마음을 가지고 있다.
댓글 없음:
댓글 쓰기