2018년 10월 1일 월요일

LS-BSR의 에러 해결: "File is supposed to contain nucleotides, but doesn't look correct..exiting"

Marker gene 염기서열을 읽어들이는 과정에서 이러한 오류가 발생하였다. 사용한 gene database는 Virulence Factors of Pathogenic Bacteria(다운로드 링크)의 것이다.
File is supposed to contain nucleotides, but doesn't look correct..exiting
어느 유전자 서열에 문제가 있는지 해당하는 것의 ID라도 밝혀주면 좋으련만, 위에서 보인 에러 메시지 한 줄이 전부이다. 도대체 뭐가 문제일까? 마커 유전자 파일의 일부만을 이용하면 문제가 발생하지 않는다.

혹시 FASTA 파일에 non-ATGC character가 있어서 그런 것일까? Artemis에서 확인을 해 보았다.


이게 뭐란 말인가! 비정상적인 염기 문자를 갖는 서열을 FASTA file에서 아예 삭제를 해 버릴까? 아니다. 그렇게 되면 소중한 정보를 잃는 것이 아니겠는가? 이것을 펩티드 서열로 전환하여 실행하면 어떨까? 

EMBOSS:transeq을 사용하여 염기서열 파일을 펩티드 서열로 전환한 뒤 다시 LS-BSR을 실행해 보았다. 이번에는 잘 진행이 되었다. 

댓글 없음: