심혈을 기울여 flow cell에 시료를 주입하는 이수현 연구원. |
Rapid sequencing kit를 사용한 반응물을 주입하고 24 시간 running을 실시하였다. MinKNOW 프로그램에서 local basecalling으로 설정을 하였으나 러닝이 끝날 때까지 겨우 2% 밖에 진행이 되지 않았다. 만들어진 read는 140 만 개가 넘으며 추정되는 염기쌍은 무려 10 Gb! 1 년 전에는 48 시간 표준 러닝에서 1 Gb 정도가 얻어질 것이라 하였는데 이제 throughput이 얼마나 올라갔는지 놀랍기만 하다.
포어 하나를 DNA가 통과하면서 획득된 모든 정보는 하나의 fast5 파일에 저장된다. 이것이 basecalling을 거치면 내부에 염기정보가 수록된 fast5 파일과 fastq로 각각 저장된다. fastq 파일은 4,000 개의 서열이 차곡차곡 담긴 상태이다.
러닝 중에 추출된 겨우 8개의 fastq 파일만으로도 de novo assembly를 하기에 충분하였다. 평균 길이는 6.1 kb, total length는 98 Mb이다. 추정되는 genome size는 50 kb 정도이므로 이미 2,000x나 된다. 일단 이것으로 canu assembly를 하였고, circlator를 거치니 하나의 contig가 나온다. 그러나 교정이 충분히 되지 않아서 그런지 서열 시작과 끝 부분의 redundancy를 제거하지는 못하였다(circular genome으로 추정). 이는 Racon으로 polishing을 하여 다시 circlator를 실행하면 해결될 것으로 생각한다.
MinKNOW를 실행하던 중에 우분투의 소프트웨어 업데이트 메시지가 나타났다. 시퀀싱을 마치고 하루가 지난 다음 이를 적용하여 재부팅을 했더니 application list에서 프로그램 아이콘이 하나도 보이질 않았다(새로 만든 파일은 보인다). 이건 또 무슨 버그인가? 터미널 창을 열 수가 없다! 파일 매니저를 열고 프로그램이 있는 디렉토리로 이동하여 xterm 혹은 gnome-terminal을 여는 수고를 해야만 했다. 구글을 검색해 보니 우분투에서 발생하는 버그라고 한다.
Newly installed applications do not show in the dash
실행 중인 프로세스 중에서 unity-scope-loader를 죽이면 된다고 한다. 이를 따라서 했더니 프로그램 목록이 잘 보인다. 재부팅을 하면 어떻게 될지 잘 모르겠다.
수정 후 정상 작동하는 대시보드. |
댓글 없음:
댓글 쓰기