2021년 1월 11일 월요일

추억의 454 software(gsMapper)

JCVI(J. Craig Venter Institute)에서 2010년쯤에 Roche/454 플랫폼으로 시퀀싱한 raw data를 mapping에 쓸 일이 생겼다. Fastq로 덤프하여 CLC Genomics Workbench 또는 bwa MEM으로 reference mapping을 해 보았는데 매핑 효율이 영 좋지 않다. Sample description이 잘못되었을 가능성이 가장 크다. SFF로 덤프하여 CLC Genomics Workbench의 legacy 기능으로 임포트해도 결과는 같다. 현재 CLC Genomics Workbench에서 정식으로 지원하는 SFF 자료는 Ion Torrent에 대한 것만이 남아 있다.

그게 아니라면, Roche에서 배포했었던 '정품' 소프트웨어가 가장 정확한 매핑 결과를 낼지도 모른다는 생각이 들었다. 그 프로그램 이름이 뭐였더라...  gs로 시작했던 것 같은데 기억이 잘 나지 않는다. 내가 국내 학술지인 Genomics & Informatics에 2006년에 쓴 소박한 논문이 하나 있는데 여기에서 언급했던 것 같다. 오랜만에 PDF를 구해서 본문을 찾아보니 gsMapper였다. 그렇지, gsAssembler 및 gsMapper!

그런데 프로그램을 어디서 구할 수 있지? 아마도 내 컴퓨터에 그대로 들어있지는 않을까? 유틸리티를 모아둔 디렉토리를 찾아보니 정말로 '02_Roche-GS'라는 디렉토리에 2007년부터 2010년까지 배포된 offInstrumentApps가 고스란히 남아 있었다. MS-DOS 시절의 게임 프로그램을 복원하여 실행한다는 기분으로 압축을 푼 뒤 실행을 해 보았다.

외견상으로는 뭔가 일어날 것만 같지만 제 기능을 하지는 못하였다. 설치 스크립트를 실행하여 다시 작동을 시키니 라이브러리가 맞지 않는다는 에러 메시지가 나왔다. 아마도 2010년 무렵의 리눅스 환경을 가상으로 만들어서 실행하면 돌아갈지도 모르겠다.

조금 더 정체가 명확한 MiSeq raw data를 발견하여 당장은 이를 이용한 매핑을 진행하는 것으로 마무리하려 한다. 


댓글 없음: