2019년 11월 16일 토요일

mg-GlobOS 0.11(1911)의 탄생

이번 월요일에 있었던 미생물 유전체 해독 및 분석 교육에서 사전에 준비했던 자료를 수업 시간에 전부 소화하지 못한 아쉬움을 달래기 위하여 당시에 사용한 환경을 리눅스 가상 머신으로 만들어 그 OVA 파일을 배포하기로 결심을 하였다. 이름은 mg-GlobOS라고 지었다. mg는 microbial genome, Globe는 내가 쓰는 도메인인 GenoGlobe(.com 및 .kr)에서 딴 것이며, OS는 CentOS처럼 Operating System을 의미한다. 첫 공개판의 버전은 0.11 (1911)이다.

공식 웹사이트는 다음의 위치로 정했다.

http://genoglobe.kr/kribb/mg-globos

OVA 파일 및 실습용 데이터는 나의 구글 드라이브에 올려서 전체 공개를 해 놓았다. 일루미나 플랫폼으로 읽은 미생물 유전체의 데이터를 평가, 조립, 매핑, 비교 분석 및 pan-genome analysis 등을 하기 위한 프로그램들을 bioconda 및 기타 방법으로 설치하였고, 전체 과정을 재현할 수 있는 스크립트와 샘플 데이터를 준비해 두었다.

어쩌면 TORMES 파이프라인(PubMed 링크)과 같은 것을 잘 익혀서 교육 및 실무용으로 사용하는 것이 더 효율적일지도 모른다. 그러나 작업 스타일에 따라서 가져다 붙여야 하는 요소 프로그램이 전부 다르므로 한 가지 파이프라인이 꾸준하게 살아남는 일은 드물다. 오히려 특정 기능을 담당하는 'killer app'은 계속 살아남지만 말이다.

mg-GlobOS를 유지하고 개선하는 일 자체가 나에게는 보람있는 일이 될 것이라 믿는다.

아나콘다를 설치해 놓은 다음 필요한 conda package를 하나씩 설치하다보면 dependency 사이에 inconsistency가 있다면서 거의 모든 패키지를 홀라당 뒤집어 엎는 일이 생긴다. mg-GlobOS에서도 첫번째 패키지인 khmer를 설치한 뒤 jellyfish를 설치할 때 뭔가 심상치 않은 일이 있음을 느꼈고, 나중에 다른 패키지를 설치할 때 전체를 뒤집어 엎는 듯한 메시지를 만났었다. 비록 치명적인 에러가 발생하지는 않았지만 왜 이런 일이 벌어지는지 늘 그 원인이 궁금했었다. GitHub의 conda 이슈 목록에 올라온 다음의 글에서 해결 방안이 보이는 듯하다.

After fresh install of 2019.03, second run of conda upgrade --all removes nearly all packages. #8940 (o12joyns의 7월 23일 코멘트를 참고할 것)

Anaconda 설치 직후 conda upgrade --all을 두 차례 실시하면 된다. 쉽게 말해서 설치에 사용한 anaconda distro와 현재의 차이점을 전부 없애주는 일이라고 생각할 수 있다. 일부 패키지가 custom 버전으로 되돌아갔다가 다시 원상복구(혹은 업데이트?)되는 것은 결코 바람직하지는 않지만 현실은 그러하다.

갑자기 upgrade와 update의 차이점이 궁금해지기 시작했다!

댓글 없음: