2015년 4월 21일 화요일

CLC Genomics Workbench의 contig join(v8.0 기준)

요즘은 미생물 유전체의 NGS data를 가지고 de novo assembly를 하는데 A5-miseq(PDF)를 애용하고 있다. Read의 오류 교정부터 scaffolding 및 assembly의 교정까지를 최적화된 파이프라인으로 실행해 주기 때문이다. 몇 가지 샘플에 대해서 CLC Genomics Workbench와 비교해 본 결과 조립 성적이 더 좋다. 대신 실행 시간은 좀 더 오래 걸린다. 그렇다고 해서 CLC Genomics Workbench와 결별을 하겠다는 것은 아니다. 시각적인 결과가 필요할 때에는 이것이 월등하니까.

효모의 데이터를 다루면서 미토콘드리아 게놈에 해당할 것으로 추정되는 콘티그를 뒤적이다가 분홍색 annotation 화살표를 발견하였다. 지금까지는 본 적이 없던 표시이다.



"Contigs joined"라니? 마우스 포인터를 가져가 보았다. 다음과 같은 노트가 표시된다. 약 46 kb에 이르는 contig 하나에 이런 표지가 총 3개 존재한다.

A repeat or another ambiguous structure was solved using paired reads and two contigs could be joined into one.

친절하기도 하다. 그러나 read depth 측면에서는 그렇게 아름답지는 않다...

댓글 없음: