2024년 6월 25일 화요일

20년은 역사를 논하기에는 긴 기간이 아니다

지금부터 20년 전에 내가 경험한 일, 혹은 내가 지난 20년 동안 열심히 해 온 일. 그 어느 것도 역사라는 측면에서 논하기에는 많이 부족하다는 것을 요즘 느끼고 있다. 20년 전이라는 과거는 충분히 오래 전도 아니고, 20년이라는 기간은 대단한 경험과 실력을 축적할 만큼 긴 세월도 아니다.

국가바이오데이터스테이션(K-BDS)에 꾸역꾸역 밀어 넣을 과거 연구 자료를 정리하면서 설명문을 작성하는 것이 큰 일이 되고 있다. 단지 컴퓨터에 남은 자료 자체나 기억에 의존하는 것에는 한계가 있어서 이전에 근무하던 사무실에서 총 11권의 수기 연구 노트를 들고 왔다. 작성 일자는 2003년 1월 29일부터 2007년 10월 22일까지였다. 연구 노트 관리 제도가 시행된 후부터는 과제 번호가 찍힌 노트를 수령하여 작성한 뒤, 과제 종료 후에는 제출을 해는 것이 의무가 되어서 더 이상 보유하지 못하였다. 전자 연구 노트는 거의 사용하지 않았다. 등록 데이터의 유형 또한 '기타'로 한정해야 한다는 점이 K-BDS에 다소 미안하게 느껴진다. 하지만 어쩔 수 없다. Sequencing raw data file, sequence with annotation... 이러한 방식으로 정해진 양식(예: sequence reads, array, 일반적인 서열 자료, proteomics, metabolocis, 화합물, 이미지, 전임상)을 써서는 내가 갖고 있는 자료를 등록하기 어렵기 때문이다. 그래서 나는 ZenodoFigshare와 같이 양식에 구애받지 않고 자료를 등록할 수 있는 리포지토리를 매우 좋아한다. 

2003년 1월부터 손으로 쓴 열 권의 연구 노트. 관리 시스템이 적용되기 전에 쓴 것이라서 연구소에 공식 제출도 되지 않는다. 여담이지만 글씨는 내 평생의 콤플렉스이다. 

나는 연구 노트를 마치 일기를 쓰듯 상세하게 문장으로 풀어서 쓰는 스타일이다. 그렇기 때문에 분량은 많아지지만 나중에 다시 들추어 보았을 때 이해하기가 쉽다. 요즘은 대장균 BL21(DE3)의 유전체 해독 자료를 정리하는 중인데, 지금까지 수행한 어떤 유전체 프로젝트보다 매우 복잡한 과정을 거쳤기 때문에 과거의 연구 노트를 들추어 보지 않고서는 이해하기 어렵다. 논문(J. Mol. Biol. 2009, PubMed)의 Materials and Methods 섹션에서는 워낙 개략적으로 작성을 해 놓아서 이것만 참조해서는 컴퓨터의 자료를 정리하여 국가바이오데이터스테이션에 그대로 넣기가 어렵다. 단순하게 'sequencing raw data file'이라고 해 버리면 아주 무책임하고도 쉽게 등록할 수 있지만, 기록이 본능인 '나'라는 동물은 그게 잘 허락되지 않는다.

먼저 대장균 REL606의 closed chromosome sequence가 기반이 되었다. REL606은 미국 미시간 주립대의 리처드 렌스키 교수가 1988년부터 지금까지 진행하고 있는 long-term experimental evolution 연구의 첫 세대에 해당하는 균주이다. 50 ml 삼각플라스크에 10 ml의 액체 배지를 담고 REL606을 접종하여 배양한다. 솜으로 만든 마개도 아닌, 작은 비커를 뒤집어 씌운 것이 뚜껑에 해당한다. 이것 수십 개가 shaking incubator에서 돌아간다고 상상해 보라. 유리 '뚜껑'이 플라스크에 부딛히는 소리가 꽤 시끄럽다.

다음날 같은 시각에 1%(V/V)를 취하여 새 배지로 옮겨 접종한다. 이렇게 하면 하루에 약 6.64 세대가 지나는 것에 해당한다. 매일같이 계대배양을 하여 1천 세대, 2천 세대... 그리하여 2010년에는 5만 세대가 되었다. 물론 플라스크는 패러랠하게 여러 개를 사용한다. 그러면 각 용기 안에서는 나름대로 다른 방향으로 진화가 이루어 진다. 

원 균주와 진화를 거친 균주의 fitness는 어떻게 비교할까? 이미 멸종한 네안데르탈인과 현대인을 서로 싸움을 시켜서 누가 더 힘이 센지 비교하기는 어렵다. 그러나 미생물은 조상님을 냉동고에 잘 보존했다가 다시 꺼내 녹이면 그대로 살아난다. 아라비노스 이용능 유전자를 표지로 삼았기 때문에 동일 agar plate에서 조상(님)과 현 세대의 균주를 같이 깔아서 색깔에 따른 콜로니를 각각 세어서 직접적인 fitness 비교가 가능하다.

원래 KRIBB에서는 렌스키 교수와 교류를 통해서 직접 균주를 받아서 유전체 해독을 하고 있었다. 그런데 우리가 모르는 사이 이 균주가 프랑스 Genoscope(National Center of Sequencing)로 전파되어 그곳에서 상당한 진도로 유전체 해독 프로젝트가 진행되고 있음을 알게 되었다. 그래서 당시 과제 책임자였던 김지현 교수(현 연세대학교)께서 지구를 한 바퀴 돌면서 관련 연구자들을 모두 만났고, REL606 균주의 유전체 해독 마무리는 Genoscope에서 완결하는 것으로 결론을 내렸다. 나는 그 염기서열을 받아서 수작업으로 annotation을 실시하여 GenBank에 등록하였었다.

REL606의 유전체 염기서열은 BL21(DE3) 유전체 프로젝트에도 유용하게 쓰였다. 이것을 reference로 하여 지금은 잊혀진 기술인 NimbleGen의 comparative genome sequencing(CGS, chip-based)을 수행하였고, Roche/454 pyrosequencing(이것 역시 잊혀진 기술)으로 assembly도 같이 진행하였다. 이 결과를 종합하여 107개의 high quality contig를 만들었다. 그 다음으로는 fosmid library의 end sequencing 결과를 그 위에 얹어서 scaffold를 구성한 뒤, 남은 gap을 메꾸어서 완성된 염기서열을 얻었다. BL21(DE3)의 유전체 해독을 위해 컴퓨터에서 이루어지는 모든 작업은 내가 하였다. 모두 열심히 노력한 결과 2009년의 J. Mol. Biol. 논문에는 이 두 가지의 대장균 B strain에 대한 유전체 해독 및 분석 결과가 같이 실렸다. 그 후에 engineered phage인 DE3를 갖고 있지 않은 BL21(Takara에서 구입)의 유전체 해독도 실시하여 짤막한 논문을 발표하기도 하였다(PubMed).

NimbleGen에 CGS 서비스를 맡기고 결과를 기다리는 동안 REL606의 유전체 염기서열은 'minor revision'을 거쳤다. 그래서 SNP가 확인된 위치를 수 bp 바꾸어야 했었다. 또한 GS 20으로 만든 데이터로는 de novo assembly와 reference-based assembly를 같이 수행하여 서로를 비교한 뒤 불일치한 부분은 PCR/Sanger sequencing으로 확인하였다. 이러한 복잡한 '역사'를 설명 문서로 재작성한 뒤 당시에 사용했던 복잡한 ace file을 포함한 데이터 파일과 함께 K-BDS에 제출하는 것이 과연 합당한 일일까? 거의 20년 전에 기록한 연구 노트를 다시 찾아보는 노력을 들일 가치가 있는 일일까? 아니, 과연 가능하기는 할까? 2006년의 노트를 뒤적거리면서 실마리를 찾으려고 애쓰면서도 이런 의문이 계속 남는다.

정년 퇴직을 할 때까지 고민을 해도 이 질문에 대한 대답을 얻지 못할지도 모른다. 어쩌면 경주의 어느 유적지에서 열심히 흙을 파는 문화재(요즘은 '국가유산'이라 부른다) 발굴단원의 심정도 나와 비슷할지 모른다. 아니다! 발굴단원은 훨씬 분명한 자부심과 목표 의식을 가지고 땅을 파면서 유물을 수습하고 있을 것이다.

필요한 일을 하고 있다고 믿자. 우리가 인지하는 세상은 명백하고도 관찰 가능한 실체와 사실이 아니다. 인지 활동을 통해 뇌에서 재구성되는 믿음이 세상의 실체일 것이다. 옳다고 믿는 일을 하는 것, 그것이 행복의 지름길이다.

그렇다면 행복이란... 세포들이 도파민에 젖어 있는 상태 아닌가? 세상은 뇌에서 재구성한 그 '무엇'이고, 우리가 느끼는 감정(심지어 정의감까지!)은 호르몬이 지배한다. 영화 매트릭스의 파란 약이 만들어 주는 세상과 별로 다르지 않다. 연구 노트 사진으로 시작한 글이 영 이상한 결말로 끝났다.


2024년 7월 1일 업데이트

추억의 이미지를 하나 소개한다. 대장균 K-12와 B strain의 유전자 발현에 같이 쓸 수 있게 만든 microarray(GPL7395) 제작 후 시험적으로 생산한 파일이다. 프로브 설계를 위한 기본 데이터는 21C 프론티어 미생물유전체활용기술개발사업단에서 제공하였고 칩 제작 및 실험은 디지털지노믹스에서 수행하였다. 


꽤 많은 칩을 제작하여 커뮤니티에 배포하였었는데 정작 GEO에 등록된 것은 현 건국대학교 윤성호 교수와 내가 관여한 것 30 샘플이 전부다. 데이터는 다 어디로 갔는가?

댓글 없음: