2018년 4월 4일 수요일

Bioconda의 혼란을 극복해 나가기

Bioconda를 이용하여 여러 프로그램을 깔면서 느꼈던 혼란은 어쩌면 나의 무지에서 비롯된 것인지도 모른다. 지웠다 깔았다를 반복하면서 새 리눅스 서버의 패키지 관리 체계를 나름대로 다음과 같이 확정하기로 마음을 먹었다.

R과 R Studio는 yum을 이용하여 설치한다. 참조한 사이트는 "How to Install R / R Studio on CentOS 7"였다. 다음으로는 관리자 권한으로 Anaconda2-5.1.0을 설치하였다. 처음에는 Anaconda3-5.1.0을 몇차례 설치하였었지만 파이썬 2.7을 기본으로 하는 것이 가장 바람직하다는 결론을 내린 것이다. 설치 루트는 로컬 하드디스크(보통 /opt/anaconda#)가 아니라 일부러 NFS로 마운트한 공용 공간을 택하였다. 나중에 이를 공유하고 있는 다른 컴퓨터에서도 쉽게 접근이 가능하게 만들기 위함이다.

Anaconda가 제공하는 파이썬 및 bioconda로 설치한 응용프로그램을 이용하려면 다음 명령어 한 줄이면 족하다. /data를 공유하는 다른 컴퓨터에서 로그인을 해도 마찬가지이다. 단, 아나콘다 루트는 관리자가 쓸 수 있는 공간(/data/anaconda2)에 위치하므로 패키지 및 환경 관리를 위해서는 관리자 권한으로 실시해야 한다.

$ PATH=/data/anaconda2/bin:$PATH

다음으로는 파이썬 3.5를 기반으로 하는 새로운 환경인 py35를 생성하였다.

# conda create -n py35 python=3.5

파이썬 3.5 이상이 필요한 프로그램들은 여기에서 설치하면 된다.

# source activate py35
(py35) # conda install roary
(py35) # source deactivate
#

원래 시스템에서 제공하는 Perl이 있었고 BioPerl도 내가 깔아 두었었지만 bioconda에서 환경 및 패키지를 설치하면서 각자 새로 깔아버리는 것은 어쩔 도리가 없다. 다음은 세균의 rRNA 예측기인 Barrnap(GitHub link)에서 설명하는 프로그램 설치법이다. 이제는 conda와 Homebrew·Linuxbrew라는 패키지 관리 시스템을 이용하는 것이 대세로 자리잡은 것 같다. 물론 Galaxy를 빼먹어서는 안될 것이다.


더군다나 Bioconda에서 배포하는 패키지는 docker 환경에서 적재할 수 있는(용어를 정확하게 선택했는지 자신이 없다) 콘테이너를 제공한다. 여기에는 BioContainer라는 재미난 이름이 붙었다. 이제 일반 사용자가 생명정보분석용 응용프로그램을 설치하는데 어려움을 겪는 일은 점점 줄어들 것으로 보인다.

Bioconda를 이용하여 패키지를 설치할 때 가장 주의할 점은 파이썬 인터프리터에 대한 의존성이 있는지를 잘 확인하여 필요하다면 py35 환경 안에서 설치하는 것이다. 그리고 설치 과정에서 이미 설치된 패키지를 업/다운그레이드하면서 건드리는 경우가 있는데, 이때에 이전에 설치한 패키지의 실행에 영향을 미치지 않는지도 눈여겨보아야 할 것이다.

댓글 없음: