2017년 10월 18일 수요일

새롭게 공부하는 RNA-seq data analysis

늘 세균의 genome(sequencing & analysis)만 편식하다가 인체 세포주에서 유래한 RNA-seq data를 건드릴 기회가 생겼다. 아주 드물게 진핵생명체의 RNA-seq data를 다룬 경험이 있지만 워낙 빈도가 적어서 기법을 숙달할 만한 수준에는 조금 부족했었다. 좋은 기회라고 생각하고 데이터를 들여다보기 시작하였다.

라이브러리 제작과 시퀀싱, 기초 분석은 (주)이바이오젠에서 수행한 것이다. Lexogen이라는 회사의 QuantSeq 3' mRNA-seq library prep kit(workflow 그림 설명)를 사용하여 시퀀싱 라이브러리를 만든 뒤 Illumina NextSeq 500(data sheet PDF file)에서 75nt SE 시퀀싱을 한 것이다. 둘 다 내게는 생소한 키트요, 장비가 아닐 수 없다. 왜냐하면 늘 TruSeq 라이브러리 제작 키트를 사용하면 만든 genomic library를 HiSeq 2500 아니면 MiSeq으로 시퀀싱을 한 결과를 받아서 이용했기 때문이다. 그것도 아니면 PacBio RSII였으니까.

2016년 3월에 있었던 이바이오젠의 QuantSeq 실험분석 할인행사 광고를 보자. 이것이 일루미나의 TruSeq standard total RNA에 비교하여 어떤 장점이 있을까? 3'-end를 좀 더 능률적으로 잡아낸다는 것(그래서 gene counting에 유리), 그리고 단편화된 mRNA도 시퀀싱이 가능하다는 것, 비용이 저렴하다는 것 등이다. Transcript의 3'-end에 집중하므로 alternative splicing/isoform을 검출하지는 못하지만, 발현체의 정량적 분석에서는 매우 좋은 키트라고 한다. 일루미나의 TruSeq 키트에서는 stranded mRNA kit가 아닌 경우에는 poly(A) tail을 활용하지 않는다(그림 설명 - 일루미나의 공식 웹사이트는 아니지만 친절하게 잘 설명함). 따라서 한 transcript에 대하여 여러 fragment가 생기고, 이는 발현값을 결정하는데 어려움으로 작용한다.

일루미나의 NextSeq 500은 또 무엇인가? NextSeq 시리즈는 벤치탑 형태의 시퀀싱 장비이다. 웹사이트에 따르면 "The first high-throughput benchtop sequencer"라고 자랑스럽게 소개하였다. 그러면 MiSeq은 benchtop sequencer가 아닌가? 현존하는 일루미나의 benchtop sequencer 3 종(MiniSeq, MiSeq, 그리고 NextSeq)을 비교한 웹사이트를 둘러보면 그럭저럭 이해는 간다. Throughput 측면에서 MiSeq은 진핵생물의 유전체/전사체 시퀀싱을 할 수준이 안된다. 지금 내가 매만지고 있는 QuantSeq 라이브러리의 시퀀싱 결과물은 총 6개의 fastq 파일인데 전부 합치면 10,099,183,772 bp / 132,883,997 seqs; 76.0 bp average이다. 약 10 기가베이스페어, 1억3288만 read나 된다. HiSeq이라면 모르겠지만 MiSeq으로는 감당이 될 수준이 아니다. 그래서 미생물과 진행생물의 시퀀싱을 골고루 서비스하려는 회사에서 선택한 장비인 것으로 생각된다. HiSeq은 아무래도 production scale sequencer로서 가격이 비싸기 때문일 것이다. 그런데 재미있는 것은 benchtop sequencer와 production-scale sequencer 양쪽 카테고리에 NextSeq이 전부 걸쳐있다. 앞으로 내가 시퀀싱 장비를 직접 구입할 일은 없겠지만, 응용 분야에 맞추어 일루미나 장비를 고르고 싶다면 sequencing platform comparison tool 웹사이트를 방문하면 된다.

2014년에 NextSeq 시리즈(500)가 HiSeq X Ten과 같이 출시되었을 때 이를 MiSeq 및 HiSeq과 비교한 글이 있어서 소개하고자 한다.

How dose NextSeq 500 compare with MiSeq and HiSeq?

반면에 7 reasons why the NextSeq 500 is a strange choice라는 글도 있었다. 이 글이 씌여진 것은 2014년이니 이미 3년이나 지난 지금은 상황이 어떻게 변했는지 살펴보는 것도 재미있을 것이다.

우연하게 접한 일이 돌이켜보니 많은 의미가 있던 것으로 평가를 내리게 되는 일이 적지 않게 생긴다. 그래서 내가 '기회'라는 말을 참 좋아한다.

댓글 1개:

Unknown :

잘읽었습니다. 감사합니다^^

mitochondriang.tistory.com