2023년 2월 10일 금요일

미안해요, GGDC(Genome-to-genome distance calculator)!

미생물의 유전체 염기서열을 입력하면 dDDH 값을 계산해 주는 GGCD는 프로그램을 배포하지 않고 웹사이트를 통해서만 서비스를 한다. 따라서 웹 브라우저에서 마우스를 클릭하여 계산할 파일을 일일이 넣어 주어야 한다. Query는 하나, recerence는 최대 75개까지 넣을 수 있다.

45개 유전체 파일에 대해서 모든 쌍의 dDDH를 계산하려면 총 45번을 제출해야 한다. query는 하나씩, reference는 45개 전체에 대해서.

서열을 밀어 넣으면서 내가 점점 GGDC 서버의 계산 능력을 잡아먹고 있음을 확인할 수 있었다. 시작할 때는 14% 정도였으나 이내 78%까지 올라갔다. 아, 미안하여라.

Query가 6개 남았다. 이제 조금만 더 하면 서열 제출 작업은 끝이다. 그런데 이게 웬일? 

78%에서 갑자기 100%가 된다는 것을 믿을 수가 없다. 다른 곳에서 갑자기 작업 요청이 밀려 들었나? 혹은 멀리 한국의 한 IP 주소에서 대량의 작업 요청이 들어오는 것을 시스템(또는 관리자)이 알아채고 공평한 사용을 위하여 내 접근을 차단한 것일까?

이 글을 쓰느라 잠시 쉬었다가 재접속을 해 보았다. 휴, 42%로 사용량이 줄어들었고 이내 14%가 되었다.

dDDH 매트릭스로 heatmap을 그리는 사람들은 나와 똑같은 원시적(?)인 방법으로 GGDC 서버를 이용하는 것일까? 그렇지는 않을 것이다. 웹 프로그래밍에 능숙한 사람이라면 자동 제출 스크립트를 짤 수도 있을 것이다. 내 능력 범위를 벗어나는 일이다. 주말에는 좀 쉬도록 하고, 결과 이메일이 날아오면 R 코드와 더불어 시간을 보내야 되겠다.

댓글 없음: