2022년 8월 29일 월요일

KRIBBuntu-focal_2207 제작 완료 및 공개

2022년 8월이 다 지나가는데 버전 2207이라니 부끄럽기만 하다. 7월에 만든 배포(distro)에 사소한 문제가 있어서 이를 어제 수정하였고, export와 import를 거쳐 이상이 없음을 확인한 다음, 구글 드라이브에 올려서 공개형태로 전환하였다(xz 포맷으로 압축한 KRIBBubtu-focal_2207의 구글 드라이브 링크). 제작 과정에 대한 상세한 설명은 다음의 위키 페이지에 나온다.

KRIBBuntu-focal_2205 distro 제작 및 재설치 과정 

위키 페이지 타이틀은 버전 2205(a)에 관한 것처럼 보이지만, 버전 2207를 만드는 과정이 포함되었다. KRIBBuntu-focal_2207에서 실행할 수 있는 미생물 유전체 분석 명령어 모음은 여기(엑셀 파일)에 있다. 파일 이름이 percent encoding 상태라서 보기에 좋지 않다. 엑셀 파일의 원래 이름은 '실습용_명령어_모음_220726_.xlsx'이다. 도쿠위키(DokuWiki)에서 한글로 표시된 URL 또는 파일명을 의도한 대로 표시하려면 어떻게 해야 될런지... 위키 엔진의 문제인지 혹은 접속에 사용하는 웹브라우저의 설정 문제인지 나도 잘 모르겠다.

정작 KRIBBuntu가 무엇인지는 제대로 설명하지 않았다. KRIBBuntu란, Linux용 Windows 하위 시스템(Windows Subsystem for Linux, 줄여서 WSL이라 부름)에서 돌아가도록 만든 우분투 기반의 배포이다. 'focal'이란 Focal Fossa, 즉 우분투 20.04LTS를 기반으로 했음을 의미한다. KRIBBuntu를 만든 목적은 올해 세 차례 진행했던 미생물 유전체 분석 실습 때문이었다. 일반적인 데스크탑이나 노트북 컴퓨터에 부담 없이 설치하여 NGS read(short, long, short + long hybrid)의 조립과 평가, 조립물에서 추출한 16S rRNA 염기서열에 대한 분석, ANI 분석 등을 실시하는 것이 목표였고, 명령어 모음에서는 꽤 수준 높은(?) Bash shell script 작성 기법을 소개하기도 하였다.

Conda에 크게 의존하고 있지만 버전 2207에서는 mamba도 조금씩 사용하였다. Dependency를 면밀하게 검토하여 conda package를 빠르게 설치하는 데에는 conda보다 mamba가 월등한 것 같다. 버전 2207을 만들 때에는 sudo 명령어를 쓰지 않았다. 왜냐하면 리눅스 서버를 오직 일반 사용자 권한으로만 써야 하는 사람도 있기 때문이다. KRIBBuntu-focal_2207을 WSL에 설치하는 설명(별로 친절하지는 않음, 죄송...)을 잘 참조한다면, 본격적인 리눅스 서버에 미생물 유전체 분석용 응용 프로그램을 설치하는데 도움을 받을 수 있을 것이다.

버전 2207은 최근 구입한 ThinkPad E14 G3(AMD Ryzen 7 Mobile 5700U, 16GB memory, Windows 11)에서 테스트를 완료하였다. 버전 2205에는 포함하지 않았던 canu assembler와 prokka를 넣었다는 것도 크게 달라진 점이다. 단, canu를 돌리려면 시간이 많이 걸리고, WSL용 메모리도 넉넉하게 확보해야 한다. 아마 기본 설정은 시스템에 설치된 물리적 메모리의 50%일 것이다.

버전 2207에 각종 응용 프로그램을 설치하면서 극복해야 할 문제가 상당히 많았었다. 이를 위키 문서에 상세하게 소개한다면 직접 프로그램을 개별적으로 설치해 보려는 사람들(WSL이 되었든 진짜 리눅스 데스크탑이 되었든)에게 도움이 될 것이다. 내가 계속 게으름을 발휘한다면 문서 업데이트에 너무 몰두하지 말고 그저 xz 압축 파일을 가져다가 활용하라고 유도하게 될 것이다.

댓글 없음: