2017년 6월 9일 금요일

Oxford Nanopore sequencing 첫 시도는 실패로 끝나다

오랜 기간 준비를 하여 큰 기대를 갖고서 첫 샘플을 올렸다. 그러나 결과는 처참한 실패였다. 2D lambda control experiment kit(SQK-LSK208)로 만든 것이라서 소중한 실제 샘플을 허무하게 낭비하지는 않았다. 모든 여건이 최적의 상태는 아니었다. 필요한 반응액과 소모품 등이 Oxford Nanopore에서 권장하는 '바로 그것'은 아니었다. 그렇다 하더라도 데이터 처리 쪽에서는 나름대로 오래 공부를 하여 준비하느라고 애를 썼는데 아직도 그 과정에서 아리송함을 갖고 있다는 것이 내 자존심을 많이 건드렸다.

Oxford Nanopore Technologies라는 회사명을 줄여서 ONT라고 부른다. 실험 노트 파일을 열어보니 OTN으로 잘못 타이프를 한 것이 눈에 뜨였다. OTN, OTZ, OTz. OTL... 어디서 많이 본 약자이다. 아, 그렇구나! 좌절한 모습을 영문자로 표현한 것이었다. 바로 지금 나의 모습을 그대로 보여주는 문자열이다.

다양한 배리에이션은 여기에서: http://moyaa44.blogspot.kr/2011/02/otl.html
EPI2ME desktop agent가 돌아가는 방식도 아직 완벽하게 이해하지 못한 상태이다. 처음에 Input Directory를 개별적인 run folder로 설정하는 바람에 새로운 시퀀싱 결과가 생성되어도 이를 자동적으로 업로드하지 못하는 우스꽝스런 상황이 되고 말았다. 문제는 이것을 고칠 방법을 모르겠다는 것이다. 그저 단순하게 C:\data\reads로만 해 두면 될 것을.

Live basecall은 1D 시퀀싱에서만 지원한다고 하여 basecall 없이 fast5 파일을 만들었다. Metrichor(EPI2ME) 서비스를 통한 basecall을 하지 않았다 해도 다른 방법으로 어떻게든 될 것이라 생각을 했던 것이다. 그래서 third party basecaller로는 잘 알려진 poretools를 리눅스에 설치하여 fast5 파일을 공급하니 유효한 시퀀스가 전혀 없다고 나온다. 이런? 프로그램 설치를 잘못했나? 패키지에 포함된 샘플 read에 대해서는 결과가 잘 나오니 그렇게 말하기는 어려웠다. 이번에는 ONT 커뮤니티 사이트에서 보급하는 basecaller인 Albacore를 설치하여 MinION을 구동한 윈도우 10 컴퓨터에서 실행을 하여 fastq 파일을 뽑아내었다. 하나의 pore를 DNA 가닥 하나가 통과하면서 얻어진 염기서열 정보에 해당하는 하나씩의 fast5 파일 여러개를 묶어서 fastq file하나가 만들어지는 것은 꽤 마음에 든다. 얻어진 Fastq file을 CLC로 임포트하여 read length 분포와 quality를 보았다. 처참하다! Lambda DNA sequence에 대한 매핑 결과는 물론 말할 것도 없다. Nanopore sequencing read에 좀 더 특화된 mapper를 쓰지 못한 탓도 있겠지만 근본적으로 이건 시퀀싱이 아니다!

다음으로는 EPI2ME에 업로드한 결과가 어떻게 되었는지를 살펴보았다. 웹사이트에서는 아예 리포트가 나오질 않았고, 다운로드한 read는 전부 fail 디렉토리에 존재한다. 이걸 보면 input directory를 띨띨하게 만들긴 했어도 클라우드쪽이 분석 작업은 잘 돌았다는 뜻이다. 그러나 결과는 매우 좋지 않다! poretools를 이용하여 fast5 파일 내에서 염기서열 이전의 정보를 뽑아내 보았으나 아무것도 반환되는 값이 없다. 

Albacore가 사기를 치지는 않았을 것이니 분명히 미약하나마 염기서열 신호가 나온 것으로 여겨진다. 다만 멀고 먼 최적화의 길이 앞에 펼쳐져있을 따름이다. 좀 더 경험이 쌓이면 MinKNOW 작동 화면만 보고서도 '아, 이번 러닝은 망했구나!'하고 판단이 될 것이다. 국내에는 대리점도 아직 없고, Nanopore community에 직접 질문을 올려서 다른 사용자가 답을 주기를 기다려야 하는 현실에서 troubleshooting을 하기란 참으로 난감하다. 이러한 여건에서 어떻게 KAIST 조병관 교수팀에서는 이미 1년 전 Scientific Reports에 Analysis of the mouse gut microbiome using full-length 16S rRNA amplicon sequencing이라는 논문을 냈는지 신기하기만 하다. 

수십년 전 대학원생 시절로 돌아가서 최초의 plasmid prep을 하다가 깨진 염색체 DNA만 길게 끌린 전기영동 사진을 얻은 기억을 되살리자. 누구나 실수는 할 수 있는 법이니...

2017년 6월 12일에 추가한 글


양질의 시퀀싱 결과를 만들어냈다는 자랑스런 글을 보니 배가 아프다! 이러다가 long read 만들기 경연대회라도 열리는 것은 아닌지?

댓글 없음: