2025년 3월 19일 수요일

[KORG X2 Self-Repair] 분해할 결심, 수리할 결심

올해 상반기에는 Korg X2 Music Workstation의 택트 스위치를 고체하기로 드디어 결심하였다. 별도로 운영하는 위키 사이트에 My old synths and MIDI라는 문서를 새로 만들고 관련 정보를 정리하기 시작하였다. 인터넷에는 X2/X3의 설정이나 자가 수리에 관한 정보가 점점 줄어들고 있으니, 완전히 사라지기 전에 나도 충분히 정보를 수집해야 할 것이다. 예를 들어 Korg X3 Connection이라는 값진 웹사이트는 2002년 9월 21일이 마지막 업데이트였다. 만약 이 웹사이트를 관리하는 Ludovic Grossard가 이를 완전히 내리기로 마음을 먹는다면 정말 곤란할 것이다. Korg X2/X3보다 앞서 나온 01/W의 수리에 관해 정말 풍부한 정보가 담긴 웹사이트가 있었던 것을 기억한다. 일부는 X2/X3에도 적용 가능한 정보였는데, 이제는 이 웹사이트가 보이지 않는다. 

2025년 3월 19일 촬영

상태를 확인하기 위해 정말 오랜만에 X2를 가져다가 전원을 넣고 소리를 들어 보았다. 셋업이 지워지지 않은 것을 보니 아직 내장 리튬 배터리는 잘 살아 있는 것 같다. 그러나 헤드폰 출력에서 '쉿-'하는 잡음이 심하고, 출력 단자(6.35 mm TS) 중 R 채널은 유격이 심하고 케이블을 건드려 줘야만 소리가 나는 것을 보니 PCB에서 납땜이 떨어진 것 같다. 생각보다 손을 볼 곳이 많다. 그나마 다행스럽게도 마스터 키보드로서의 동작은 완벽하였다. 

X2의 동작 확인을 기념하기 위하여 예전에 오디오 파일로 녹음해 놓은 데모곡을 동영상으로 만들어서 유튜브에 올렸다. 



과거 X2를 몇 차례 자가수리하면서 뒷판을 열기 위해 풀어 놓은 스크류의 규격이 약간 다르다는 것을 알고 몹시 당황한 적이 있었다. 재조립 시 맞는 구멍을 정확히 알지 못해서 대충 돌려서 끼워 넣었는데, 그 과정에서 본체의 나삿니가 망가진 것도 있을 것이다. 어제 비로소 서비스 매뉴얼 파일을 펼쳐 보았더니 3x8 스크류와 4x10 스크류를 정확히 구분해서 제 위치에 박아 넣어야 한다는 것을 알게 되었다. 이번에 수리를 하게 되면 같은 실수를 반복하지 않으리라.

출처: X3 service manual.

그동안의 DIY 경험이 적지 않으니 커넥터의 납땜을 보수하거나, 택트 스위치를 교체하는 정도는 별 어려움이 없을 것이다. 프리셋 설정을 SysEx로 덤프하여 파일로 받은 것이 있고, 이를 MIDI를 통해 다시 X2로 보내는 것도 이미 해 보았다. 이를 위한 MIDI-Ox 프로그램이 Windows 11에서 잘 작동할런지는 미지수. 하지만 리눅스 PC에서 MIDI 데이터나 SysEx를 다룰 수 있는 유틸리티가 있으니 별로 걱정은 하지 않는다. 

교체를 위한 부품을 IC114에 주문하였다. 접촉불량 택트 스위치를 교체하였을 때의 상쾌함은 해 보지 않은 사람은 모른다.

Floppy emulator에 대해서도 관심이 많은데, 비용이 많이 드는 수리라서 아직은 뒷조사만 열심히 하고 있다. 플로피 디스크나 MIDI 케이블을 통해 전송되는 데이터 및 파일에 대해서 충분히 공부한 뒤 필요하다고 생각되면 착수할 일이다. 가끔 Killer Organ 소리가 듣고 싶을 때, MIDI로 설정을 전송하는 것보다 더 쉽게 할 수 있다면 투자를 해 봄직하다. 

2025년 3월 16일 일요일

빠르면 빠른 대로, 느리면 느린 대로

서울에서 약 1만 보 넘게 걸으며 돌아다니다가 대전에 돌아왔다. 좀 피곤했지만 달리기를 빼먹을 수는 없는 노릇이라 기록에 연연하지 않기로 하고 집을 나섰다. 속도는 느리지만 거리 목표를 평소와 같이 7.2 km로 맞추었으니 달린 시간은 조금 더 늘어났다. 페이스는 6분 35초였다. 3월의 6회차 달리기 중에서는 가장 느렸다.

그랬더니...


'최장 시간 신기록'을 달성했다고 한다. '오늘은 왜 이렇게 천천히 달리셨나요'라고 실망을 안기는 메시지를 들을 줄 알았는데 오래 달렸다는 이유로 상을 받았다. 기록의 측면을 페이스(속도)가 아니라 달린 시간으로 평가한다면 틀린 말은 아니다. 발상을 아주 약간 전환하여 달리는 사람의 의욕을 북돋을 수 있으면 그것도 좋은 일 아니겠는가?

최장 시간 신기록 어워드를 보고 있노라니 조만간 50분 지속 달리기를 일상으로 해야 될 것만 같은 생각이 든다. 8 km를 50분에 달린다면 페이스는 6분 15초에 해당한다. 이는 여름이 지나야 겨우 달성 가능한 목표라고 생각한다. 



하와이, 캐나다, 그리고 대한민국

주말, 광화문 인근은 아침부터 시위 준비로 분주하다. 의자를 배치하고, 커피를 나누어 주거나 시위용품을 판매하는 모습을 보니 마치 장터를 보는 듯하다. 이윽고 대로변은 주차 중인 전세 버스로 가득해지고, 본격적인 시위가 시작되면서 선동적인 목소리가 확성기를 통해 울려 퍼진다. 이것과는 대조적으로 광장으로부터 수백 미터만 벗어나면 평온한 주말을 즐기는 사람들이 차분하게 오간다. 나는 어디에 있어야 하는가? 언제까지 광장에서 목소리를 드높이는 사람들(좌든 우든)에게 미안함이나 죄책감을 느껴야 할까? 모든 것이 어서 정상으로 돌아오기를 바랄 뿐이다.



최근 트럼프 미 대통령은 캐나다를 미국의 51번째 주로 만들자는 발언을 해서 큰 물의를 불러 일으켰다. 실현 가능성은 전혀 없는 말이지만, 캐나다 국민들은 이에 대해 얼마나 불쾌했겠는가. 잠시 우리의 현실을 돌아보자. 광장의 절반을 메운 사람들은 늘 태극기와 성조기를 같이 들고 나온다. 왜 성조기를 들고 거리로 나와야 하는 것인지 이해하기 어렵다. 우리는 캐나다처럼 미국과 국경 전체를 마주하고 있지도 않고, 대미 교역량 역시 캐나다의 약 1/4 수준이다. 미국에게 우리는 몇 개의 중요한 나라 중 그저 하나일 뿐이다. 그 중에서 가장 중요한 나라가 되게 만드는 것은 당장은 외교의 몫이겠지만, 나라 전체가 상식적으로 돌아가는 모습을 보이는 것이 더 중요하다.

그런데 왜 우리는 거리 시위 때마다 성조기를 흔들고 있는 것일까? 민주정부 수립 과정과 6·25 전쟁 참전 등 우리 현대사에 미친 미국의 영향력이 너무나 크고 고마워서? '공산화'의 위협에 처한 대한민국을 구할 수 있는 나라는 미국뿐이니 그들의 관심을 불러 일으키기 위해서? 

영국 일간 가디언은 태극기부대에 미국은 동맹국 이상의 의미이자, 이상향(ideal)이라고 설명한다. 그래서 성조기는 시위대가 현재 위협받고 있다고 느끼는 넓은 의미의 문화적 정신적 질서를 상징한다는 것이다. 태극기부대 일원인 70대 남성의 “트럼프가 한국을 올바른 궤도로 되돌리는 데 도움을 주기 바란다”는 말도 소개했다. 미국을 ‘기독교에 바탕을 둔 민주주의 신성한 수호자’로 여기는 이런 태도는 특정 교회를 중심으로 빠르게 강화되고 있다고 지적한다.

이 글은 한국일보에 실린 글이다('태극기 부대가 성조기를 든 이유', 링크).

거리의 함성이 가깝게 들리는 서울시립미술관 서소문 본관에서 열리고 있는 김성환의 개인전 《Ua a‘o ‘ia ‘o ia e ia 우아 아오 이아 오 이아 에 이아》(링크)을 둘러보았다. 전시의 일환으로서 드류 브로데릭이 기획한 '하와이 트리엔날레 2022'를 발췌한 영상물이 상영되고 있었다. 하와이 트리엔날레는 하와이의 전통과 문화를 현대적인 시각으로 재해석하는 예술 축제로서 매 3년마다 개최된다(Copilot 설명). 이 영상물을 통해 하와이가 어떻게 미국의 50번째 주가 되었는지, 휴양지라는 이미지 뒤에 원주민들의 생활과 문화는 어떻게 소외되고 자본의 그늘의 가려 하류층 시민으로 전락하였는지, 그리고 전세계 천문학자들이 '천문학의 성지' 하와이에 앞다투어 설치한 고성능 망원경이 그들의 신성한 산('마우나 케아')을 어떻게 망가뜨렸는지 등 평소에 관심을 잘 두지 않았던 문제들을 알게 되었다. 이번 전시를 통해 알 수 있었다. 특히 천문대 건립을 둘러싸고 지역 사회와 갈등을 빚고 있었다는 것은 전혀 몰랐기에 이에 대한 2019년 보도를 찾아 링크를 남겨 둔다.

화가 강명희의 초기작. 전시 안내 및 언론 기사.

뮤지엄샵에서.

다음주에는 혼란한 상황이 빨리 마무리되기를 바라는 마음이 간절하다.




2025년 3월 11일 화요일

무릎에서 '뚝' 소리가 나도 7.2 km를 달렸다

거실 바닥에 앉아 있다가 자세를 바꾸는데 갑자기 오른쪽 무릎에서 '뚝'하는 소리가 났다. 나의 관절에서 나는 소리 중에서 가장 데시벨이 큰 소리였다. 뭐가 부러졌나? 잠시 뒤에 자세를 바꾸는데 또 소리가 났다.

별의별 생각이 머리를 스치고 지나간다. 달리기 8개월차에 드디어 나도 부상인가... 첫 달에 오른발 엄지발톱 밑에 피가 고였다가 아물면서 발톱이 들뜬 상태이고, 가끔 무릎이 뻑적지근하게 느껴지는 것 말고는 특별한 일은 없었다.

반원상연골이 파열된 것일까? 운동 중도 아니고 집에서 저녁을 먹고 쉬다가 이런 일이 생기기는 어렵다. 일어나서 이리저리 몸을 움직여 보았다. 무릎에서는 아무런 통증이 없다. 관절에서 나는 '딱' 또는 '뚝'소리는 기포가 생겨서 터지는 것이라는 설이 있다. 물론 다른 이유도 있겠지만. 아프지 않으니 부상은 아닐 것이라 생각하고 운동복을 챙겼다.

그리하여 3월 네 번째 저녁 달리기를 하러 집을 나섰다. 기온은 영상 8도라서 조금만 뛰면 덥게 느껴진다. 3월부터는 7.2 km씩을 달린다. 일주일에 한 번은 8 km를 달려 보고 싶었던 것이 2월의 당찬 계획이었다. 그러나 7 km 대를 무난히 달리는 체력을 충분히 쌓은 뒤 8 km로 거리를 늘리는 것이 좋을 것이다. 

네 번 달리는 동안 기록이 아주 조금씩 좋아지고 있다. 4월까지의 목표는 6분 15초 페이스를 만들어 내는 것이다. 이런 추세라면 올해 안에 6분 이내의 페이스로 들어갈 것 같다. 




이번 달리기에서는 후반부에서 속도가 느려지지 않도록 꽤나 노력을 했다. 달리기를 마친 직후, 그리고 하루가 지난 오늘 아침까지 무릎과 다리에는 아무런 이상이 없고 피로감도 느껴지지 않는다. 무릎에서 유별나게 큰 소리가 난 것에 대해 걱정을 할 필요가 없다고 본다.

2025년 3월 9일 일요일

와이다이(WiDi)? 미라캐스트(Miracast)?

TV에 75옴 동축 케이블, 즉 안테나로부터 오는 선을 연결하는 것 외에 다른 대안이 없던 시절은 정말로 모든 것이 단순하였다. VTR이 나오면서 세 가지 색깔의 RCA 단자가 나오더니 이어서 셋톱박스가 나오고 급기야 현재 통용되는 HDMI까지... 세상이 복잡해지면서 TV 설치와 작동에 대한 내 지식은 옅어져 가기 시작하였다. 어쩌다 출장이나 여행을 갔을 때 숙박업소에 비치된 TV와 관련한 리모콘이 두 개일 경우에는 슬슬 짜증이 밀려오기 시작하였다. 그렇다고 해서 내가 심각한 기계치인 것은 아니다. 다만 TV와 관련한 최신 기술을 따라잡는 것에는 별 관심이 없다는 뜻이다. 더군다나 요즘은 TV와 인터넷, 그리고 스마트폰까지 결합되어 온갖 복잡한 서비스를 누리는 세상이 아닌가. LG전자에서는 가전위키 TV편을 통해서 TV와 관련된 기술을 매우 쉽게 설명해 주고 있으니 앞으로 TV를 새로 구입할 일이 있으면 여기를 참조해 보는 것도 좋을 것이다. 물론 늘 최신 기술을 갈구하는 얼리 어댑터에게는 이 위키 페이지의 정보가 매우 부족하겠지만 말이다.

우리 가족이 브라운관 TV에 이별을 고하고 처음 구입한 평판 디스플레이 TV는 47인치(119 cm) 디스플레이를 갖는 LG 47LD662이다. 이 제품의 최대 해상도는 Full HD(1920 x1080)라서 아직 넷플릭스 등을 재생하는데 큰 문제는 없는 수준이다. 2011년 구입 직후 수리가 불가능한 고장이 발생하여 새 제품으로 교체한 뒤 지금껏 써 왔다. 파견 근무를 나간 총 3년 반의 기간 동안은 켜지 않았으니 14년 내내 쓴 것은 아니다.





작년 쯤부터 이 TV가 말썽을 일으키기 시작한 것 같다. 처음에는 1세대 크롬캐스트의 상태가 좋지 않아서 TV가 제대로 신호를 받지 못한다고 생각했었다. 아래 사진에 보였듯이 커넥터 부분이 무엇인가에 눌려서 꺾이는 바람에 그런 일이 벌어지는 것으로 본 것이다. 


크롬캐스트 역시 오래 된 물건이라서 이를 대체할 것을 찾아야만 했다. 서두에 TV 관련 기술에 대해 내가 잘 모른다고 쓴 것은 바로 이 상황을 뜻하는 것이었다. 이런 종류의 장치를 뭐라고 부르는지도 몰랐으니까. 크롬캐스트는 4세대를 마지막으로 더 이상 만들지 않는다고 한다. 재고를 소진할 때까지는 계속 판매를 하겠지만, 이제는 가격도 훨씬 비싼 '구글 TV 스트리머'라는 것으로 바뀌었다고 한다(관련 소식 링크). 구글 TV 스트리머는 셋톱박스 유사한 것과 리모콘으로 구성되어 있다.

종전의 크롬캐스트를 대체할 수 있는 것을 구입하기 위해 쿠팡을 뒤져보다가 유난히 가격이 싼 것을 발견하여 점심 한 끼 먹은 셈으로 치고 주문을 하였다. D-Link라는 기업의 'MAINSTAGE' TV 어댑터인 DHD-131이라는 것이었다. 너무 오래된 물건을 싸게 처분하는 것임을 진작에 눈치챘어야 하는 것인데... 매뉴얼 인쇄일은 우리집 TV와 같은 2011년 4월! 이 제품이 쿠팡에서 '미라캐스트 동글'을 입력했을 때 상위에 오르는 신비한 알고리즘을 나는 미처 깨닫지 못하였다.




와이다이(Wi-Di)는 무엇인가? WIDI라고 쓰면 블루투스를 통한 무선 MIDI 데이터 전송 기술이니 혼동을 해서는 안된다. WiDi는 인텔이 만든 기술로서 노트북, 태블릿, 스마트폰 등의 화면을 TV나 프로젝터에 무선으로 미러링(전송)하는 기능을 제공한다. 그러나 미라캐스트(Miracast)라는 오픈 표준 기술이 나오면서 경쟁력을 잃어서 이미 2015년에 인텔은 지원을 종료하였고 지금은 미라캐스트에 자리를 내 주었다고 한다. 가장 훌륭한 무선 캐스팅은 Wi-Fi 공유기 같은 것을 거치지 않고 완벽한 기기 대 기기 무선 연결을 지원해 주는 것이다. 지금 여기까지는 상용화된 것으로 보인다.

미래를 생각한다면 '미라캐스트 동글'을 주문하는 것이 현명했을 것이다. 어쨌거나 이 물건은 Windows 11이나 최신 스마트폰(갤럭시의 경우 'Smart View')에서 사용하지 못하는 것은 아니다. 신기술이 나와도 당분간은 하위 호환성을 지켜 주니 다행이 아닐 수 없다.

테스트 중인 TV는 LG 47LD662.

스마트폰의 화면을 캐스트하면서 '카메라'앱을 켠 장면. TV in TV? 이것은 LG의 제품이 아니라 인켈 브랜드의 32E4000이다(2018년 9월 제조). 수도권에서 파견 근무를 하는 기간 동안 쓰기 위해 서둘러 구입했던 것이다. 매우 가벼운 제품이라 집 안에서 이리저리 옮겨다니며 쓰기 좋다.


몇 대의 TV를 번갈아 가면서 테스트해 본 결과 다음과 같은 종합적인 결론을 내릴 수 있었다.

  • 우리집 크롬캐스트 1세대는 정상이다.
  • 우리집 LG TV의 HDMI 단자 3개 중에서 2개는 불량이다.
  • 무슨 이유인지 우리집 네트워크 환경에서는 디즈니+의 캐스팅이 잘 되지 않는다. 스마트폰에서 재생하는 것은 문제가 되지 않는다.
  • DHD-131은 TV를 바꾸어 연결하면 작동이 잘 되지 않는다. 뒷면의 리세트 버튼을 눌러서 기존의 프로파일을 삭제해야 되는 것 같다. 이에 대해서는 연구를 좀 더 해 봐야 한다.
  • Windows 11 노트북 컴퓨터의 화면을 DHD-131를 경유하여 TV로 보내는 것은 아직도 성공하지 못했다. [Windows + K] 단축기를 누른다는 것만 일단 암기해 두었다.

크롬캐스트 1세대와 달리 DHD-131(WiDi)는 스마트폰의 화면을 그대로 TV로 보내주는 점이 편리하였다. 처음에 테스트를 할 때에는 매번 화면에 나타나는 PIN 번호를 넣어야 하고, 전체화면을 맞추는 법을 몰라서 약간 불편하게 느껴졌었다.

다음에 새 TV를 살 때에는 아마도 인터넷 기능이 일체화된 스마트 TV를 주문하게 될 것 같다. 화면은 얼마나 큰 것으로 해야 될까? 그게 가장 큰 고민일 것이다.

가벼움이 장점인 32E4000의 활용 방안. Apple TV+에 가입하여 파친코 시즌 2를 보는 모습이다. 이 드라마를 바라보는 불편한 시각에 대해서는 조만간 별도의 글을 쓸 계획이다. 





2025년 3월 4일 화요일

휴덕은 있어도 탈덕은 없다

경상남도 상주시에 출장을 가서 상주보 부근 경천섬이 바라보이는 곳을 차를 몰고 지나치다가 눈에 번쩍 뜨이는 어떤 편액을 만나게 되었다. 흔히 '현판'이라는 낱말을 쓰고는 하는데, 현판은 나무판이나 종이 등에 글씨를 써서 거는 액자류를 통틀어 일컫는다. 건물의 이름을 써서 건물 정면의 문과 처마 사이에 거는 목판은 편액이라고 부른다. 

검정 바탕에 흰 글씨로 선명하게 새겨진 그것은 바로 입덕문(入德門)!




이곳은 선조 때 세워진 서원인 도남서원이다. 입덕문을 통과하면 성인의 덕을 배우게 된다는 뜻에서 이런 편액을 흔히 달았던 것으로 알고 있다. 그런데 약간 덜 진지하게 말하자면 '입덕'이란 대중문화에 깊은 관심을 갖게 되는 일을 부르는 말로도 쓰인다. 1970년대 일본에 등장한 신조어인 '오타쿠'가 한국에서는 '오덕후', '덕후'로 바뀌더니, 이 세계에 들어서는 것을 '입덕'이라고 부르게 된 것으로 보인다.

입덕의 대상은 주로 만화책, 애니메이션, 피규어 등이다. 하지만 대상을 한정할 필요는 없지 않은가? 악기 연습이나 녹음에 몰두하고 있다면 그것도 '입덕'이다. 생각해 보면 나도 다양한 분야로 입덕을 거치고 있다. 2월 초에 있었던 공연 때문에 잠시 손을 놓았던 진공관 앰프 개조 작업도 다시 시작해야 한다. '휴덕은 있어도 탈덕은 없다'는 나에게도 적용되는 말일 것이다. 

현재 나의 최우선 덕질 대상은 달리기일까? 경북 여행을 겸한 2박3일 동안 달리기를 하지 못하였다. 날씨가 매우 나빴고 낯선 곳이라 코스를 새로 짜기도 어려웠던 탓도 있지만, 왼쪽 무릎이 보내는 '좀 쉬고 싶다'는 신호를 더 이상 무시하기 어려웠다. 

오늘은 거리에 연연하지 말고 가볍게 뛰어 보겠다. 

밤 10시 5분, 달리기를 마쳤다. 기온은 영상 4도. 7 km / 45분 22초 / 6분 28초의 페이스. 런데이 앱에서 몇 개의 배지를 받았다.

이보다 7 km 기록이 더 좋은 날이 많이 있었는데 왜 오늘 신기록 배지를 받았는지 알 수 없다. 



2박3일에 걸쳐 대전에서 상주로 가기

부석사, 소수서원, 도산서원, 하회마을. 지난 이틀 동안 들른 곳이다. 긴 우회로를 거쳐 오늘(3월 3일) 저녁에 드디어 최종 목적지인 상주에 도착하였다.

부석사 석등과 무량수전.



아내는 무량수전 배흘림 기둥에 기대앉았다.

영주 소수서원 입구에서.





상상외로 거대했던 안동 법흥사지 칠층전탑.


임금이 내려 준 '도산서원'이란 이름을 명필 한석봉이 선조 앞에서 직접 썼다는 이야기가 전한다. 내부에는 '전교당'이라는 편액이 걸려 있다. 


도산서원 앞마당에서 낙동강을 바라보면 기묘하게 생긴 둔덕이 있다. 이는 시사단(試士壇)이라고 부른다. 정조때 퇴계 이황을 추모하기 위해 이곳에서 과거 시험을 치른 것을 기념하기 위해 지은 작은 건축물인데, 안동댐이 만들어지면 수몰 위기에 처하자 약 10미터 높이의 언덕을 만들어 그 위로 옮겼다고 한다.


아무도 밟지 않은 눈길을 밟으며 퇴계 이황의 묘소에 들렀다.



이름도, 벼슬도 새겨져 있지 않은 묘비의 한가운데 새겨진 글은 
'퇴도만은 진성이공지묘(退陶晩隱眞城李公之墓)'. 퇴도는 퇴계가 쓰던 호의 하나이고, 만은은 늦게 은거했다는 뜻이다. 진성은 본관. 좌측에 새겨진 글은 퇴계가 생전에 직접 지었다고 한다. 이에 대한 해석은 여기를 참고하라.

성리학, 또는 유학이 21세기를 사는 우리에게 부르짖는 바는 무엇일까? 어제 영주의 소수서원과 선비촌 박물관을 둘러보면서 시작된 골치아픈 물음은 여행 이틀째 더욱 내 머릿속을 강하게 울리고 있었다. 볼거리와 맛있는 음식을 찾아 눈과 입을 자극하는 여행이 아니라 관념을 뒤흔들며 질문을 던지는 여행이 되었다.

나는 유학 또는 유교에 대해 매우 비판적인 사람이다. 그러나 제대로 비판을 하려면 제대로 아는 것부터 출발해야 한다. 그러려면 한자 공부부터 시작해야 할까? 같은 시간을 투자한다면 차라리 한자보다 영어 공부를 하는 것이 더 나을까?

한국고전번역원 - 새로운 해석이 필요한 유교와 유학

명종의 어필 편액. 이로써 소수서원은 최초의 사액서원이 되었다. 3월 2일에 방문하였다.


도산서원에서 멀지 않은 이육사 문학관(안타깝게도 오늘은 휴관일...)에서 바라본 풍광이 예사롭지 않았다. 한 폭의 수묵화로 표현한 겨울 산을 보는 듯하였다.

옥빛으로 빚나며 하회마을을 휘감아 흐르는 낙동강물. 여기는 하회 옥연 구곡이다. 물 저편으로 보이는 것이 조금 뒤에 오를 부용대이다. 바위 색깔도 예사롭지 않았다. 안동의 '지질학'이 궁금하다.


부용대에 올라 바라본 하회마을. 여행 이틀째의 마지막 코스였다. 여기를 오르지 않았으면 후회했을 것이다.



선비란 무엇인가? 학식과 인격을 갖춘 사람으로서 아직 벼슬에 오르지 않은 '양반'이라는 것이 문제이다. 선비 정신을 현대에도 가치 있는 것으로 인정하려면, 신분에 의한 진입 장벽이 분명히 존재했던 과거의 기준을 털어 내야 한다고 믿는다. 양인(양반, 중인, 상민)뿐만 아니라 비록 노비로서 생존을 위해 힘겨운 삶을 살고 있다고 하여도 고매한 인격을 갖추고 있으며 시간을 내어 학문에 힘쓰고 있다면 선비라 불러 마땅하다.

조선시대에는 벼슬살이를 하는 것이 선비의 완성이었다. 모욕을 참으면서 때를 기다리다가 권력자를 만나 비로소 세상에 드러나는 것도 그러한 방법의 하나일 것이다. 그러나 이러한 자세는 나의 신념과는 잘 맞지 않는다. 옳다는 생각도 잘 들지 않는다.

노동을 천시하지 않고, 모든 국민에게 공평하게 부과된 의무를 회피하지 않으며(서원은 세금과 병역을 회피하는 수단으로 변질되된 것으로 알고 있음) 권력 지향적인 자세를 과감히 버릴 때, 그러한 선비 정신이라면 현대에도 계승할 가치가 있다고 본다. 

2025년 3월 3일 월요일

예기치 않은 FASTQ 파일 조작 실수가 가져온 새로운 발견?

10년도 더 된 옛날 만든 미생물의 일루미나 시퀀싱 데이터를 정리하여 국가바이오데이터스테이션(K-BDS)에 등록하는 '유전체 박물관(고물상?)'에 열심히 매진하는 과정에서 데이터 검수 책임을 맡는 관리자에게 늘 고마운 마음을 갖게 된다. 등록 당시에 포함된 어이없는 오류를 바로잡기 위해 번거로운 부탁을 해도 매번 잘 수용해 주기 때문이다. 아직 GenBank의 서열 정보와 같이 버전 관리가 이루어지고 있지는 않지만, 앞으로는 이 기능이 포함되리라 믿는다.

최근 품질관리 담당자로부터 내 HiSeq 2000 raw sequencing data(FASTQ 파일)를 검수하는 과정에서 동일한 서열 ID가 중복하여 나타난다는 소식을 들었다. 당시에는 한 샘플의 FASTQ 파일이 너무 크면 001, 002...와 같은 이름을 붙여서 분할한 형태로 제공하였었다. 이를 'cat' 명령어로 하나의 FASTQ 파일로 합치는 과정에서 똑같은 원본 파일을 두 차례 반복하여 이어 붙인 것이 원인이었다.

72개의 샘플 중에서 이런 문제가 발생한 것은 6가지였다. 문제를 수정한 뒤 모든 분석 작업, 즉 jellyfish를 이용한 21-mer abundance analysis, phyloFlash, ZGA pipeline 및 GTDB-Tk를 전부 새로 실시하였다. 특히 GTDB-Tk는 공식 문서를 기계적으로 따라하다가 너무 오래된 소프트웨어 및 reference DB를 설치하였음을 발견하고 최근 재설치를 하였기에 어차피 모든 데이터에 대한 재작업이 필요한 상태였다. Sequence read ID가 전부 2회씩 중복하여 존재함에도 불구하고 내가 사용한 그 어떤 소프트웨어도 오류 메시지를 뱉어내지 않았었다. 아마도 프로그램 내부에서는 read ID를 전부 단순한 일련번호와 같은 것으로 치환하여 쓰고 있는 것이 아닐까 한다.

수정된 FASTQ 파일을 이용하여 재분석을 하던 과정 중에 Methanobrevibacter smithii의 어느 균주에 대한 시퀀싱 데이터가 이상하다는 것을 발견하였다. FASTQ 파일에 오류가 있었을 때, 즉 정상에 대하여 2배로 부풀려진 상태에서는 contig의 수가 500개에 육박하였고 CheckM(실제로는 ZGA pipeline 내부에서 실행)에서 계산한 completeness가 40%도 되지 않았었다. 그래서 sequencing coverage가 상당히 부족해서 문제가 생겼을 것이라 생각하고 더 이상 쓸 수 없는 데이터로 간주하였었다(KAP241424). 21-mer abundance analysis에서도 main peak가 그렇게 잘 드러나지 않았기에 이런 생각을 하는 것도 당연하였다.

그런데 total contig length를 보니 약 1.8 Mb였다. 이는 Methanobrevibacter smithii의 유전체 크기로 알려진 값과 매우 유사하였다. Contig의 수가 지나치게 많이 나올 정도로 sequencing coverage가 충분하지 않다면, total contig length도 매우 낮은 수준이어야 한다. 표준 균주인 ATCC 35061의 유전체를 NCBI에서 다운로드한 뒤 ZGA로 CheckM 점검을 해 보았더니 이것 역시 completeness가 40% 미만으로 나타났다. 이건 말이 되지 않는다. 두 유전체 서열에 대하여 CheckM을 직접 실행해 보았다. ZGA가 설치된 conda 환경을 그대로 이용하였으니 CheckM 버전은 ZGA pipeline의 것과 동일하다.

결과는 놀랍게도 두 균주 모두 completeness가 100%인 것으로 계산되었다. ZGA pipeline 안에서 CheckM을 실행하고 그 메시지를 처리하는 과정에 문제가 있는 것이 틀림없다(나중에 확인한 것이지만 이는 나의 오해였음). 따라서 내가 시퀀싱한 Methanobrevibacter smithii 균주는 아무런 문제가 없으며, 분리 정보만 되찾아 정리한다면 K-BDS에 등록하여도 아무런 품잘 상의 하자가 없으리라는 결론을 내렸다.

수정한 FASTQ 파일을 이용하여 조립을 하면 contig의 수는 겨우 41개에 불과하다(~156x coverage). 이 데이터를 그대로 duplicate하여 분량을 두 배로 만든 상태에서 조립을 하였더니 contig 수가 500개 가까이 된다? 사실 이 현상은 나의 지식이나 경험으로는 잘 이해가 가지 않는다. 일루미나의 경우 대략 150x 정도의 sequencing coverage에서 최적의 결과가 나오게 되고, 투입량을 그 이상으로 올린다고 해도 더 좋아지지는 않는다는 논문을 본 일은 있다. 하지만 투입량을 그 이상 올렸을 때 조립 결과가 심각하게 나빠진다는 것은 이해하기 어렵다.

이번 데이터에 포함된 오류는 단순히 시퀀싱 분량이 2배로 늘어난 것과는 상황이 다르다는 생각이 들었다. 시퀀싱을 한 판 더 실시하여 read를 2배로 얻었다 해도 이전의 것과 모든 염기서열과 quality가 똑같은 read가 발생할 가능성은 극히 적다. 하지만 내가 초래한 실수에서는 그렇지 않다. 완벽하게 똑같은 read가 2개씩 존재하고 있다. 그렇다면 k-mer spectrum에서 가장 왼쪽에 있는 것들(시퀀싱 오류에 의해서 1,2...회 정도의 저빈도로 존재하지만 그 종류는 가장 많은 것)이 둘 씩 만나서 짧은 contig를 다수 만들게 되는 것이 아닐까?

그림 출처: 손장일, 남진우. Present and future of de novo whole-genome assembly (https://doi.org/10.1093/bib/bbw096, Figure 4)


아직 이전 FASTQ 파일로 만든 contig의 길이 분포 및 평균 read depth를 점검해 보지는 않았다. 버릴 데이터라고 생각해서 신경을 쓰지 않았기 때문이다. 만약 이 assembly에서 짧은 low depth contig가 많은 수를 차지한다면, 나의 원인 분석이 그렇게 틀리지는 않았다는 결론을 내릴 수 있을 것이다.

그래서 '망친' 데이터라고 해서 함부로 내다 버려서는 안된다고 생각한다. 조작 실수에 의해 '망친' 것으로 오해를 할 수도 있기 때문이다. 망친 데이터의 모임인 KAP241424는 전반적인 검토를 거친 뒤 데이터와 README 파일을 바꾸어야 한다. 물론 오늘 글의 주제가 된 Methanobrevibacter smithii의 데이터는 한번 더 확인을 거쳐서 '부활'하게 될 것으로 본다.


2025년 3월 5일 업데이트 - CheckM 실행 결과의 고찰

ZGA pipeline 내부에서 CheckM을 실행할 때에는 'checkm taxonomy_wf' subcommand를 쓰되 기본적으로 bacterial marker를 사용한다. 만약 고세균이라면 '--domain archaea'라는 옵션을 주어야 한다. 문제는 바로 여기에 있었다. 여러 genome에 대하여 일괄적으로 ZGA pipeline을 돌렸으니 개별적으로 domain 정보를 주지 않았고, default setting인 bacteria 마커셋을 사용했던 것이다. 그러니 당연히 genome completeness가 40%도 되지 않는 값이 나올 수밖에... Standalone CheckM 실행에서 나는 'checkm lineage_wf' subcommand를 사용했다. 이 경우에는 domain을 소프트웨어가 알아서 판단하여 적용하는 것으로 보인다. 따라서 ZGA pipeline은 아무런 잘못이 없으며, 매뉴얼을 꼼꼼하게 읽지 않은 나의 잘못이었다.

2025년 3월 1일 토요일

달리기 입문 7개월을 마치며

어제는 너무 피곤하여 달리기를 건너 뛰었다. 긴 회의와 면접으로 몹시 바빴던 오늘, 8 km 달리기로 2월을 마무리하였다. 칼로리 소모량으로 환산한다면 라면 1인분을 불태운 셈이다. 야심차게 10 km를 채워보고 싶었으나 다리에 묵직한 피로감이 느껴져서 무리는 하지 않기로 하였다. 좀 더 달려서 둔산대교 북단을 반환점으로 삼으면 10 km 코스가 될 것이다.


2월에 달린 총 거리는 90 km를 겨우 넘긴 정도이다. 조금만 더 노력을 했더라면 100 km를 채울 수도 있었을 것이다. 다음 달에는 연속해서 10 km를 달리는 것이 가능할 것 같다. 페이스 욕심만 내지 않는다면 말이다. 

앞으로 '하루 달리기의 최소 거리는 7 km'라는 규칙을 지킬 수 있을 것이다. 2월에 총 13회를 달리는 동안 7 km 이상을 달린 것이 10회나 되기 때문이다. 7 km로 15회를 달리면 105 km가 된다. 아주 약간 '도전적'인 목표이다.

2025년 2월 25일 화요일

GTDB-Tk의 reference database를 release 220으로 업데이트한 뒤 발생하는 'Reference genome missing from FastANI database' 에러 해결하기

GTDB-Tk의 배포용 최신판에는 r202_v2 레퍼런스 데이터베이스가 포함되어 있다(혹은 '있었다?'). 최소한 내가 지난 1월에 Bioconda를 이용하여 이를 설치할 때에는 그러하였다. 최근에 공개된 미생물 표준균주의 유전체는 여기에 반영이 되어 있지 않을 것 같아서 레퍼런스 DB를 최신 버전인 r220으로 업데이트한 뒤 재분석을 실행하니 다음과 같은 에러가 발생하였다.

[2025-02-25 08:40:48] ERROR: Reference genome missing from FastANI database: /data/gtdb/release220/fastani/database/GCF/004/000/985/GCF_004000985.1_genomic.fna.gz

데이터베이스가 설치된 곳(/data/gtdb/release220/)을 확인해 보니 fastani라는 디렉토리 자체가 없다. 패키지에 포함된 download-db.sh 스트립트를 이용하여 무려 두 차례나 재설치 후 분석을 시도했으나 마찬가지였다. 데이터를 받는데 하루 종일 걸렸는데 이게 무슨 일이람... GTDB 데이터베이스 최신판의 풀 패키지는 여기에 있다(r220의 파일 크기는 101.04 GB). 만약 파일이 전송되다가 불완전한 상태로 끊겼다면 다운로드 후 설치 및 환경 설정까지 담당하는는 download-db.sh 스크립트가 정상 종료될리가 없다.

r202_v2의 설치 경로 아래에는 분명히 62 GB나 되는 fastani라는 디렉토리가 있었다. r220은 도대체 뭐가 다른가... 다시 한 번 살펴보니 디렉토리 구조가 조금 다르다. r220에는 r202_v2에는 없었던 skani라는 디렉토리가 있었다. 그 아래에 다시 database가 있고, 하위 구조를 보아하니 이 상태 그대로 fastani 하위에 심볼릭 링크를 만들면 될 것 같았다. 

이와 같이 나름대로 조치를 취한 뒤 다시 GTDB-Tk 분석을 실시하였다. 잘 돌아간다! 최종 결과 파일인 gtdbtk.bac120.summary.tsv가 무사히 생성되었다.

레퍼런스 데이터베이스의 구조가 바뀌었으면 제대로 알려 주었어야 하는 것 아닌가! 현재 설치용 배포판으로 제공하는 GTDB-Tk v2.1.1에서는 skani를 사용하기 전에 개발된 것으로 추측된다. 최신 버전은 v2.4.0인데 비교적 최근에 설치를 한 나는 왜 v2.1.1이란 말인가. 조만간 GTDB-Tk도 v2.4.0으로 업데이트를 해야 되겠다.

GitHub에 가 보니 FastANI가 skani로 대체되었다는 공지가 있었다. 개발자는 자기 할 일을 다 하고 있었는데 나만 몰랐다.

✨ New Features

GTDB-Tk v2.4.0+ includes the following new features:

  • FastANI has been replaced by skani as the primary tool for computing Average Nucleotide Identity (ANI).Users may notice slight variations in the results compared to those obtained using FastANI.

skani는 도대체 무엇인가? FastANI의 뒤를 이을 고속 분석법인가? 그렇다! 대량의 metagenome-assembled genome(MAG)을 상호 비교할 일이 많아지면서 기존의 FastANI도 느리다도 느껴지는 시대가 되었다. 특히 ANI 계산은 contamination과 incompleteness에 대하여 취약하다. skani는 단편 상태의 불완전한 MAG를 비교함에 있어서 FastANI보다 20배 이상 빠르며, 더욱 정확하다고 한다.

조금만 손 놓고 있으면 이렇게 최신 동향을 놓치게 된다. Announcements를 제대로 챙겨 보았다면 내가 설치한 GTDB-Tk 자체의 버전(2.1.0, 2022년 5월 11일)이 너무 옛날 것이라는 것을 알게 될 것이다. 늘 깨어 있으라! 현잰ㄴ 2024년 4월 24일에 배포된 2.4.0이 통용되고 있다.


2025년 2월 27일 업데이트

나의 두 눈으로 똑똑히 보고 말았다.... GTDB-Tk 공식 문서의 Bioconda를 통한 설치 관련 항목(링크)에 어떤 내용이 있었는지를...





2025년 2월 24일 월요일

k-mer 분석 프로그램인 jellyfish를 미련하게 쓰고 있었다

khmer, jellyfish, KAT... NGS read로부터 k-mer 분석을 할 때 내가 즐겨 사용하는 프로그램들이다. 초창기에는 khmer를 즐겨 사용했었다. 이 프로그램은 특히 k-mer에 대해 어떤 기준을 적용하여 필터링을 할 수 있다. 그러나 모든 작업에서 이렇게 데이터를 잘라내는 '침습적' 조작을 필요로 하지는 않는다. 요즘은 khmer의 핵심 프로그램보다는 부속 파이썬 스크립트를 쓰는 일이 많다. 예를 들어 readstats.py나 interleave-reads.py 같은 것.

그다지 크지 않은 데이터셋에 대해서 간편하게 k-mer abundance 분석을 하려면 jellyfish가 더 편리하다. 최근 K-BDS에 등록할 '묵은지와 같은' 옛날 NGS 데이터(일루미나 HiSeq 2000)을 재정비하다가 jellyfish를 아주 무식하게 쓰고 있다는 것을 깨달았다. 사실 Getting started 문서만 제대로 읽었어도 이런 비효율적인 일은 하지 않았을 것이다. 이 비효율적인 실행 방식은 몇 년이나 작동하고 있었다. 이 모든 실수는 게놈 고물상 영업을 개시하면서 비로소 드러난 것이다.

k-mer spectrum을 시각화하려면 'jellyfish count'로 k-mer를 센 뒤, 'jellyfish histo'로 히스토그램을 만든 다음 gnuplot으로 적당히 그림을 그리면 된다. 그런데 미련하게도 첫 명령어에서 산출된 파일에 대하여 'jellyfish dump'로 모든 k-mer의 수를 수록한 텍스트 파일을 뽑은 뒤 다시 여기에서 awk/uniq/sort 조합으로 히스토그램을 만들고 있었으니... 물론 이것도 나의 순수한 창작은 아니고 인터넷 어디선가 검색을 통해서 알아낸 것이었다. 이 미련한 한 줄 스크립트는 아래와 같다. SAMPLE.kmer21.txt는 'jellyfish count'의 결과 파일이다.

awk ‘{print $2}’ SAMPLE.kmer21.txt | sort -n | uniq -c | awk ‘{print $2 "," $1}' > SAMPLE.jf.hist

텍스트 파일 덤프는 정말 쓸데없는 일이었다. 처음부터 히스토그램을 뽑아내면 되는 것이었다. Fwd 및 rev read를 하나로 합쳐서 interleaved fastq file(*.pe.fq)을 만들어 놓은 다음 k-mer abundance plot을 그리는 방법을 알아보자. jellyfish 명령어로 21-mer를 세어서 히스토그램을 만든 뒤 gnuplot에서 플로팅하는 전체 명령어를 다음과 같이 재정비해 보았다. 

for x in *pe.fq
do
  echo Processing $x...
  x=${x%%.pe.fq}
  jellyfish count -m 21 -s 100M -t 12 -C $x.pe.fq -o $x.counts.jf
  jellyfish histo -o $x.jf.hist $x.counts.jf
  echo Running gnuplot...
  echo set term png > $x.jf.gp
  echo set output \"$x.jf.png\" >> $x.jf.gp
  echo set logscale x >> $x.jf.gp
  echo set logscale y >> $x.jf.gp
  echo set grid >> $x.jf.gp
  echo set xlabel \"21-mer frequency\" >> $x.jf.gp
  echo set ylabel \"number of distinct 21-mer\" >> $x.jf.gp
  echo set key off >> $x.jf.gp
  echo set title \"$x\" >> $x.jf.gp
  echo plot \"$x.jf.hist\" using 1:2 with lines >> $x.jf.gp
  gnuplot $x.jf.gp
done

실행을 마치면 *.jf.png라는 파일이 생겨날 것이다. 히스토그램 파일의 필드 구분자가 만약 콤마인 경우에는 'echo set datafile separator \“,\” » $x.jf.gp'라는 줄이 'echo plot...' 전에 들어가야 한다. 

히스토그램 파일을 넣어주면 분석 그림을 그려주는 GenomeScope라는 웹서비스도 있었다. 2020년에 Nature Communitations에 발표된 논문 제목은 'GenomeScope 2.0 and Smudgeplot for reference-free profiling of polyploid genomes'. 교싲신저자인 M.C. Schatz의 이름이 아주 낯이 익다. 어디서 봤더라... 논문 목록을 훑어보다가 'Hawkeye and AMOS'라는 2011년도 논문(링크)을 찾아냈다. 내 블로그에도 몇 차례 언급되었던 소프트웨어이고 사용했던 경험도 있다. 

2025년 2월 23일 일요일

작업 과정을 보여주는 친절한 ChatGPT - '미생물의 유전체 분석을 위한 universal single-copy gene과 관련한 연구 역사를 정리해 줘'

어떤 연구자 그룹에서 발표한 성과물이 어떤 시간 순서대로 나왔는지 알고 싶어서 ChatGPT에게 질문을 던졌다. PubMed에서 조금만 검색을 해 보면 될 일이지만, 어차피 유료로 사용하는 ChatGPT를 이런 목적으로라도 써야 하지 않겠는가. 질문은 다음과 같았다.

UCSD의 Jonathan A. Eisen이 PhyloSift와 AMPHORA, AMPHORA 2를 언제 논문으로 발표했는지 알려줘. 논문 URL도 같이 보여줘.

참고로 amphora는 고대 그리스와 로마 시대에 널리 쓰이던 길쭉한 항아리로, 두 개의 손잡이가 달렸다(위키피디아).

뉴욕 메트로폴리탄 박물관('The MET') 소장품인 Terracotta Nolan amphora(링크). 이 박물관의 소장품 사진 대부분은 자유롭게 복사, 변형, 재배포가 가능하다. 심지어 상업적 용도라 하더라도! 


조금 기다리고 있으면 최종 답변이 나올 것으로 기대하였다. 그런데 화면에서는 현재 ChatGPT가 어떤 궁리를 하면서 내가 던진 질문에 대한 답변을 준비하는지를 보여주기 시작하였다. 내가 제출한 질문을 먼저 확인하고, 정보를 찾은 뒤, 나름대로 논리적 전개를 하여 종합한 다음 마지막으로 점검하는 과정까지 친절하게 보여주는 것이었다. 예전보다는 분명히 더욱 영리해졌다. 작업 화면을 녹화하여 동영상을 만들어 보았다. 중간에 기다리는 시간이 있어서 약간 지루하게 느껴질 수도 있겠다.


이 동영상의 초기 버전을 내 유튜브 채널에 올렸다가 다시 내렸다. 정보량이 그렇게 많은 유용한 동영상은 아니라는 생각이 들었기 때문이다. ChatGPT의 최종 답변은 다음과 같았다. 위에서 보여준 중간 처리 과정과 관련한 메시지는 사라지지 않았다. 다음의 답변 맨 위에 나오는 '1m 44s 동안 이성 처리 완료'를 ChatGPT내에서 클릭하면 '이성 처리의 과정'이 다시 화면에 펼쳐져 나온다. 물론 이 블로그에서는 클릭을 해 봐야 소용이 없다.

다음은 Jonathan A. Eisen 교수 연구실과 밀접하게 관련된 세 가지 도구에 대한 논문 정보입니다.


1. PhyloSift

이 논문은 PhyloSift를 소개하며, 다양한 게놈 및 메타게놈 데이터를 이용해 계통분석을 수행하는 방법을 설명합니다.


2. AMPHORA

비록 이 원 논문의 저자 목록에는 Wu, Y.-W., Simmons, B.A. 그리고 Singer, S.W.가 포함되어 있으며 Eisen 교수의 이름은 없지만, 해당 도구는 Eisen 교수 연구실이 주도한 계통분석 연구와 밀접한 관련이 있습니다.


3. AMPHORA2

이 논문에서는 AMPHORA의 개선판인 AMPHORA2를 소개하며, 미생물 게놈의 계통분석을 위한 자동화된 파이프라인을 제시하고 있습니다. 이 논문에는 Wu, Y.-W., Simmons, B.A.와 함께 Eisen 교수도 공저자로 포함되어 있습니다.


이와 같이 Eisen 교수 연구실에서는 2009년(AMPHORA)과 2013년(PhyloSift 및 AMPHORA2)에 관련 논문을 발표하였습니다. 

이 정도로 정보를 처리할 정도라면, 한 사람의 생애를 정리하여 전기나 연대기를 만드는 것도 어렵지 않아 보인다. '이성 처리'는 rational processing 또는 logical reasoning을 의미하는 것으로 보인다.

오늘 Eisen의 논문을 다시 찾아보게 된 것은 오랜만에 약 160건의 미생물 유전체를 아우르는 phylogenetic tree를 그리기 위함이었다. 5년쯤 전까지만 해도 PhyloSift를 종종 사용하였었는데, marker gene set 다운로드 링크가 더 이상 유효하지 않다. 전에 사용하던 낡은 서버에서 프로그램을 되살릴 수는 있었지만, 보다 최신의 연구 동향 및 도구가 궁금하던 차에 다른 논문을 뒤져보다가 서론 부분에서 Eisen 그룹의 연구 내용이 소개되어서 반가운 마음에 ChatGPT 신세를 좀 져 본 것이었다.

오늘 찾아본 두 편의 논문은 다음과 같다.

A revisit to universal single-copy genes in bacterial genomes - Scientific Reports 2022.

VBCG: 20 validated bacterial core genes for phylogenomic analysis with high fidelity and resolution - BMC Microbiome 2023.

첫 번째 논문은 잘 알려진 일곱 가지의 universal single-copy gene(USCG)를 평가한 것이다. 따라서 새로운 마커 유전자를 제시하거나 여러 유전체 염기서열로부터 이를 찾아내는 파이프라인을 제시하지는 않았다. 두 번째 논문(VBCG)에서 GitHub에 공개한 응용프로그램(링크)이 매우 유용해 보인다. 

두 논문의 서론 부분만 제대로 읽어도 이 분야의 연구 동향을 알아내기에 충분하다. 물론 세상에는 더 많은 마커 유전자 세트가 존재한다. 아직 두 논문을 철저하게 소화한 것은 아니지만, proGenomes database(v3 링크)에서 사용한 40개의 universal, single-copy phylogenetic marker gene("specI", Nature Methods 2013)을 언급한 것 같지는 않다. proGenomes와 specI는 Peer Bork이 이끄는 EMBL-Heidelberg에서 주도한 것으로 알고 있다. specI는 2017년에 내 블로그에서 조금 다루었었다(쉽게 쓴 원핵생물의 종 동정 이야기). proGenome v2에서 사용한 classifier는 GitHub에서 공개하고 있다(링크). phyloSift에 대한 글은 내 블로그에서 꽤 많이 작성해 놓았기에 여기에 전부 링크를 달 수는 없다. 한국에서 개발한 UBCG(up-to-date bacterial core gene set, v2)를 빼놓으면 섭섭할 것 같다.

시대가 변했으니 나도 좀 더 편리한 도구인 VBCG로 옮겨갈 때가 되었다고 본다. 실제로 설치 후 활용해 보니 매우 빠르다. 이따금 ezTree를 사용할 때도 있다. 이 프로그램은 정해진 적은 수의 marker gene set을 쓰는 것이 아니고 PFAM HMM library에 대해 query genome을 다 뒤진 뒤 공통적인 것만 걸러내는 스타일이라서 시간이 많이 걸린다.

올해 들어서 열 번 가까이 실행하고 있는 GTDB-Tk에서도 universal marker gene을 사용한다(설명 링크). 갑자기 공부할 것이 많아졌다!

2025년 2월 22일 토요일

달리는 거리를 8 km로 늘여 보았다

작년에 달리기를 처음 시작할 때의 목표는 딱 30분, 또는 5 km 정도를 지속적으로 뛰는 것이었다. 사실 이 두 개의 목표 수치는 서로 잘 맞지 않는다. 그러려면 6분 페이스를 맞추어야 하는데, 아직 내 페이스는 6분 25초 정도에 불과하기 때문이다.

요즘은 하루에 달리는 거리를 조금씩 늘려 나가고 있다. 5 km로 끝내는 날은 거의 없다. 이번 주의 세 차례 달리기에서는 7 km를 한 번, 8 km를 두 번 달려 보았다.

2월의 달리기 기록, 노란색 원은 7 km, 빨간색 원은 8 km를 달린 날이다. 

최근 6회의 달리기(7 km 4회, 8 km 2회)에서는 케이던스와 페이스도 매우 안정적으로 유지되는 편이다. 예전에는 달리기 후반부로 갈수록 속도가 떨어지는 것이 확연히 드러났었다. 어제는 오랜만에 레드미 워치를 차고 심박수를 측정해 보았다. 165 bpm을 넘겨서 경고가 발생하는 일도 없었다. 몇 달에 걸쳐서 매우 점진적인 수준이나마 개선이 이루어진 것은 분명하다. 확실히 숨은 과거보더 덜 차게 느껴진다.





8 km 달리기의 단점은 시간이 오래 걸린다는 것이다. 집을 나섰다가 돌아오는 시간을 전부 따지면 한 시간을 넘기기 쉽다. 평생 이렇게 지속적으로 시간을 투자해서 무엇인가를 해 본 일이 있었던가? 만약 같은 시간을 어학에 투자했다면? 악기를 연습하거나 레슨을 받는데 투자했다면? 논문을 읽었다면?

일주일에 세 번을 뛴다면 1~2회는 8 km를 채우는 것을 목표로 해야 되겠다. 페이스는 현 수준으로 유지하면서 몸을 적응시켜 나가는 것이 필요하다. 그러다가 7분 이내 페이스로 10 km를 뛰는 날을 하나 둘 만들어 나가면 되지 않을까? 가끔 검색을 해 보면 매일 10 km를 달리는 사람의 경험담을 읽을 수 있는데, 나에게 그런 일이 일어날 것이라고는 생각하지 않는다. 

올해의 목표는 단순하다. 기록 같은 것에 연연하지 않고 이따금 10 km를 달릴 수 있는 몸을 만드는 것, 그리고 평소에는 이틀에 한 번 간격으로 7~8 km를 달리되 6분 25초 이내의 페이스를 유지하는 것. 마지막으로 다치지 않는 것.


[업데이트] 8 km 달린 다음날의 부작용 

하루 종일 졸음이 쏟아짐. 주말이었기에 망정이지...

2025년 2월 19일 수요일

맥키 오닉스 프로듀서(Mackie Onyx Producer) 2•2를 기다리며

내가 쓰는 음악 장비는 대부분 중고, 리퍼비시, 반품 등의 사연으로 인해 할인하여 파는 것을 구입한 것이다. 지금까지 주력으로 사용해 왔던 오디오 인터페이스 역시 그러하다. Behringer U-Phoria UM2를 2023년 여름에 구입하여 녹음용으로 써 왔다.

음율의 <파도혁명> 베이스 파트를 맹렬히 연습하는 중이다. 이러한 스타일의 최신곡이 50대 초보 베이시스트의 '갬성'을 적시는 데에는 상당한 시간이 걸렸다.

구입가를 생각한다면 성능에 대해서 불만을 갖지 말아야 한다. 잡음 수준도 입문용 기기임을 감안하면 준수하고, 마이크 또는 기타 등 악기를 연결하여 녹음하는 용도로는 꽤 괜찮다. 다만 최대 샘플링 레이트가 48 kHz에 불과하고, 외부 기기의 스테레오 출력을 연결하기 불편하며(불가능한 것은 아니나 채널-2는 Hi-Z 전용이라 좌우 레벨을 잘 맞추어야 함), 자체 ASIO driver도 이제는 ASIO4ALL에 자리를 내어 준 상태이다. 반면에 같은 회사에서 만든 U-Control UCA200은 정말 작고 미니멀한 오디오 인터페이스로서 특별한 드라이버 설치 없이 무난히 잘 동작하기 때문에 단순 음악 재생용으로 컴퓨터나 라즈베리 파이(볼루미오)에 거의 고정형으로 붙여서 쓰고 있다. 나는 이 물건을 무려 세 개나 갖고 있다!(관련 글 링크). 

과거를 돌이켜 보니 저가형 오디오 인터페이스를 써서 DAW에서 가상악기를 작동시켜 보려고 애썼던 노력이 정말 눈물겹다. 중고 UM2를 구입한 이후로 그 목마름은 어느 정도 해소되었지만 여전히 아쉬운 부분이 많았다. 만약 Focusrite Scarlett Solo/Duo처럼 전국민이 다 사용한다는 오디오 인터페이스를 신품으로 구입한다면 기본적은 성능을 충족함은물론 번들 소프트웨어를 충분히 활용할 수 있으니 무료 DAW나 플러그인(이펙터 및 가상악기)를 찾아 헤매는 일도 없었을 것이다.

'나도 이제는 제대로 된 오디오 인터페이스를 써 보고 싶다'는 생각은 오래전부터 갖고 있었고, 2023년 네이버에 오른 오디오 인터페이스 50종 성능 비교라는 글을 여러 차례 참고하였었다. 요즘 유난히 싼 가격에 팔리는 Kurzweil Unite-2를 비롯하여 Behringer UMC204HD, ESI U22XT(=Artesia A22XT), Steinberg UR12, ESI Neva Uno, Presonus AudioBox USB 96 등을 알아보다가 결국 찾은 곳은 뮬 악기장터. 너무 많은 사람이 선택하는 Focusrite Scarlett은 일단 건너뛰고 중고 매물을 훑어보던 중에 좋은 가격에 나온 중고 맥키 오닉스 프로듀서 2•2를 발견하였다. 원래 맥키는 믹서나 라우드스피커 등 라이브 음향 장비 전문회사로 유명하다(역사 및 설립자 Greg Mackie의 인터뷰 링크). 나도 이 회사가 만든 TAPCO 브랜드의 Mix60이라는 소형 믹서를 잠깐 소유했던 적이 있었다. 오닉스 프로듀서 전면의 XLR/6.35 mm 콤보 잭 2조는 마이크와 Hi-Z 중에 자유롭게 할당 가능하고, 후면에는 MIDI 단자가 있으니 활용성이 매우 좋다. 루프백이 지원되지 않는다는 것을 제외하면 특별히 흠을 잡을 것이 없다.

뮬에서 발견한 맥키 오닉스 프로듀서(Mackie Onyx Producer) 2•2. 사진은 뮬 게시판에 판매자가 올린 것을 가져온 것이다.


문자를 보내어 재빨리 거래를 완료하였다. 중고품이라서 번들 소프트웨어까지 제대로 넘겨받지 못하는 것은 그대로 감수하기로 하였다. 어차피 나는 무료 프로그램을 잘 쓰고 있으니까 말이다.

U-Phoria UM2, 그동안 수고 많았다! 녹음의 기본을 알게 해 준 고마운 장비였다.

음악인(실제로 드럼 연주를 했다고 함)에서 사업가로! 나중에 시간이 생기면 Greg Mackie의 삶에 대해서 알아보고 싶다.


2025년 2월 21일 업데이트

어제 퇴근 후 배송된 오닉스 프로듀서를 꼼꼼하게 테스트해 보았다. 견고한 금속 케이스와 묵직하게 돌아가는 각종 노브는 신뢰감을 주었다. 별도 드라이버 설치를 하지 않은 상태에서도 기본적인 재생과 녹음은 된다. 드라이버를 다운로드하여 설치하였더니 ASIO 작동도 잘 되었다. 드디어 나도 24비트, 샘플링 레이트 96 kHz의 작업을 할 수 있게 되었다. 사실 48 kHz면 충분하지만...


챗GPT는 Onyx Producer를 이용한다는 것을 전제로 다음과 같이 제안하였다.

🎛 홈레코딩에 추천하는 설정

  • 44.1kHz / 24-bit: 대부분의 음악 홈레코딩에 이상적
  • 48kHz / 24-bit: 영상 작업을 고려한다면 적합

다음으로는 MIDI interface의 기능도 점검해 보았다. 롤랜드 사운드캔버스 SC-D70과 오닉스를 MIDI 케이블로 연결한 뒤, MidiEditor에서 적당한 파일을 재생해 보았다. SC-D70의 오디오 출력은 오닉스의 전면부로 입력하였다. 아무런 문제가 없었다. 테스트 과정은 OBS Studio에서 동영상을 만들어서 유튜브에 올렸다. 



Behringer U-Phoria UM2는 이제 작별을 고해야 할 듯.

인터넷에서 Greg Mackie(1949~)의 생애에 관한 자료를 찾아 보았다(위키피디아). 아마추어 무선가였던 아버지의 영향으로 어려서부터 전자 카탈로그와 부품에 노출되었던 그는 보잉사에서 근무하면서 전자공학에 관심을 갖게 되었고, 밴드 드러머로 일하면서 적은 비용으로도 더 좋은 성능의 믹서 및 프로 오디오 제품을 만드는 것이 가능하다는 신념으로 기업을 설립하였다고 한다. 챗GPT에 의하면 그는 프로페셔널 오디오 장비를 대중화한 혁신가로 여겨진다고 한다. 

가격 대비 성능비가 좋은 음악 관련 장비를 만드는 곳이라면 Uli Behringer(1961~)를 빼놓을 수 없다. 음악 산업이라고 하면 요즘은 음원을 만들고 유통하는 산업을 떠올리겠지만, 이를 가능하게 하는 장비의 개발과 제조를 떼어놓고 생각할 수는 없다. 음악은 정말 많은 사람들의 취미이다. 이를 '제품'까지 연결해 나가는 전설적인 기업인이 정말 부럽다.

 

2025년 3월 5일 업데이트

Behringer UM2는 뮬 중고악기 장터를 통해 팔렸다. 같은 물건 매물이 여럿 나와 있어서 팔리는데 시간이 좀 걸렸다.