2024년 3월 15일 금요일

[6П6С|6P6S/6P6P/6V6GT SE amplifier] 잡음의 원인은 MOSFET 리플 필터인가? 어쨌든 문제를 해결하고...

(출력관) ⮕ (초단회로) ⮕ (전원회로)로 이어지는 6P6P SE 앰프의 잡음의 원인 찾기가 과연 이번에는 성공할 수 있을 것인지... 6V6GT SE 앰프라고 쓰고 싶지만 현재 장착된 것은 중국에서 만들어진 6P6P 빔관이므로 사실에 입각하여 써야 할 것이다.

험(hum) 잡음을 없애기 위해 사용한 리플 필터가 오히려 잡음을 유발한다? 그렇게 믿을 상당한 이유는 이 글을 읽어 내려가면 알게 될 것이다. MOSFET를 이용한 리플 필터는 워낙 잘 알려진 것이므로 그 자체에는 문제가 없다고 본다. 내가 겪는 잡음은 약 1초가 조금 안되는 간격으로 발생하는 작은 '꾸르륵...꾸르륵...' 소리이다. 스피커에 귀를 가까이 대야 확인이 가능한 수준이므로 참고 살 수도 있지만 앰프 자작인의 자존심이 허락을 하지 않는다.


현재 사용 중인 (정류 +) 리플 필터 보드. FQPF2N60C(600 V, 2 A, 4.7 Ω)가 쓰였다. 옆에 놓인 반도체 소자는 여분으로 보유 중인 IRF740.

콘골트 님이 제공한 리플 필터 회로도. 빨간 사각형 부분을 적당히 개조하면 단순한 CR 평활회로가 된다. 자료 출처: 네이버 미니진공관 앰프 제작 카페.


이 리플 필터 키트를 콘골트 님(네이버 블로그, 키트/PCB 소개)으로부터 구입하여 조립 직후 MOSFET을 망가뜨린 일이 있다. 아마 배선 실수였을 것이다. 필요한 소자가 없어서 대충 시멘트 저항을 연결하여 험이 잔뜩 발생하는 상태로 잠시 쓰다가(편의상 이를 'board-B'라 하자), 나중에 MOSFET을 구입하여 새 보드('board-A')에 다시 조립한 다음부터 꾸르륵거리는 잡음에 직면하게 된 것이다.

어제 저녁, MOSFET 없이 저항 등으로 완성한 board-B를 다시 6P6P 앰프에 연결한 뒤 전원을 넣고 스피커에 귀를 대 보았다. 험은 들리지만 꾸르륵거림은 없다. board-A가 잡음의 원인일 수 있다는 의심이 들기 시작하였다. 납땜이 불량하거나 평활용 캐패시터가 불량하여 꾸르륵거리는 소리가 날 것 같지는 않다. 그렇다면 FQPF2N60C이 문제일 수도 있다는 생각이 들었다. 불량품일 수도 있고...

만약 MOSFET을 다른 것으로 바꾸어 보면 어떨까? 예전에 SMPS를 만들어 실험을 할 때 사 두었던 IRF740이 몇 개 남아 있다. 이것 말고는 달리 해 볼 수 있는 일이 없다. 당장 교체 실험을 해 봐야 되겠다.

IRF740. Infineon의 제품으로 400 V, 10 A. 


이렇게 해도 잡음이 사라지지 않는다면, 아예 진공관 앰프 전용의 SMPS를 구입하거나 또는 초크코일을 이용한 고전적인 전원회로를 써 볼 수도 있다. PCB-B에서 패턴을 끊은 뒤 5 H 200 mA 급의 초크코일을 구입하여 연결해 보면 된다. 

일반 전원 트랜스포머의 EI 코어를 전부 빼서 재배열하고 갭을 준 뒤 소출력 진공관 싱글 앰프의 출력 트랜스포머로 쓴 일이 있다. 나중에 제대로 만들어진 출력 트랜스포머로 대체한 뒤(관련 글 링크), 개조한 전원 트랜스포머는 6LQ8 SE 앰프의 초크코일 대용으로 쓰게 되었다. 험 제거 성능은 만족할 수준이었다. 따라서 마지막 선택으로서 저항-캐패시터-초크코일을 사용한 고전적인 전원회로를 택하게 되더라도 실망을 안기지는 않을 것이다.  

MOSFET 교체 실험의 결과가 어떻게 될지 매우 흥미롭다. 


2024년 3월 16일 업데이트

MOSFET를 IRF740으로 바꾸었지만(board-A') 잡음은 사라지지 않았다. 그러나 board-A'의 직류 출력단에 board-B를 추가로 연결하였더니 잡음이 없어졌다. 

MOSFET을 교체한 Board-A에 board-B를 얹었다.

브리지 정류회로와 2단 RC 평활회로(200 OHM + 270 OHM)로 구성된 Board-B를 그대로 사용하면 약 38 V의 전압 강하가 이루어진다. 이는 낭비이므로, 다이오드 브리지와 270 OHM을 건너 뛰도록 회로를 수정하였다. 최종적으로 얻어진 직류 전압은 약 238 V. 단순한 형태의 π-type RC filter를 board-A'에 추가한 셈이 되었다. 그런데 단지 이렇게 함으로써 꾸르륵거리는 잡음이 사라진다는 것은 이해하기 어렵다.

그림 출처:  What is the π-type RC and LC filter circuit identification method?

위 회로도에서 R1 양단의 전압 강하분을 통해 계산하면 77 mA 정도의 전류가 흐른다.

잡음이 발생한 이유도, 사라진 이유도 정확히 모르겠다. 배선을 마무리하고 뚜껑을 닫았다. 12DT8 기판에 연결된 신호 입력용 케이블을 납땜으로 마무리해야 하는데 너무 성가셔서 나중에 끝내기로 한다. 현재는 테스트를 하느라 꼬아서 연결한 뒤 매우 성의 없게 테이프를 감아 둔 상태이다.

어지럽다... 빨리 뚜껑을 닫자.




짧지 않은 시간을 투자하여 나름대로 탐색하고 실험을 통해서 잡음 제거라는 궁극적인 목표는 달성했지만 왜 그렇게 되었는지 알지 못한다면 참다운 배움이 아니다. 물론 생화학이나 생리학을 모른다고 하여 - 음식을 소화하고 에너지를 얻으며 움직이는 근본 원리를 모르는 - 먹고 살 자격이 없는 것은 아니겠으나.

경험만 축적하면 무얼 하겠는가?


2024년 3월 12일 화요일

새로 구입한 프리앰프 보드로도 6V6 진공관 앰프의 잡음을 없애지 못했다

예상보다 빠르게 알리익스프레스에서 주문한 진공관 프리앰프 보드가 배송되었다.

신발 모양의 기판 지지대와 JST XH 3핀 하네스 커넥터는 원래 갖고 있던 것이다.

밤 10시가 넘은 늦은 시간이었지만 큰 기대를 갖고 12DT8을 소켓에 꽂은 뒤 6V6 앰프에 연결해 보았다. 그러나... '꾸르륵 꾸르륵' 거리는 잡음이 완벽히 사라지지는 않았다.

이는 스피커에 귀를 약 30 cm 이내로 가까이 대지 않으면 느낄 수 없는 미약한 잡음이다. 실제 음악 감상을 하는 자리에서는 들리지 않으니 별 문제가 없다고 여겨도 된다. 그러나 대다수의 자작인들이 볼륨 포텐셔미터를 끝까지 돌려도 잡음이 일절 나지 않는 싱글 엔디드 진공관 앰프를 만든다. 나만 빼고!

MOSFET을 사용한 필터 회로를 전원부에 채용했음에도 불구하고 험(hum)이 들리는 것도 자존심이 상하는 일이다. 전원 트랜스포머가 '징~' 하고 소리를 내며 우는 것도 그동안 미처 눈치채지 못했었다. 일반적인 용도로 쓰이는 50 VA급의 220 V: 220 V 트랜스포머로는 다소 용량이 부족했던 것인지도 모른다. 내가 만드는 소출력 진공관 앰프의 전원회로에 관한 원칙은 범용 절연용 트랜스포머, MOSFET 리플 필터, 그리고 SMPS(히터 전원용)를 쓴다는 것이 었는데, 가장 최근에 많은 공을 들였던 6V6 싱글 엔디드 앰프 제작 프로젝트에서는 이 원칙을 충실히 따랐음에도 불구하고 잡음이 없는 앰프 제작이라는 측면에서는 좋은 성과를 내지 못했다. 

앞서 작성한 몇 편의 글에서도 밝혔듯이 여러가지 사연을 갖고 장만한 여분의 부품을 활용한다는 핑계로 늘 새로운 앰프 자작 프로젝트를 벌이고는 하였다. 결과만 놓고 보면 그럴 필요도 없었는데 교체용 진공관을 너무 많이 사 놓은 다음 이를 활용해 보자고 욕심을 낸다든가, R-코어 출력 트랜스포머를 한번 경험해 본답시고 직접 권선기까지 만들어 가면서 코일을 감고(총 두 차례), 그 결과물과 짝을 맞추기 위해 총 세 차례에 걸쳐 앰프를 만들어 본다든가...  그 과정에서 많은 시행착오를 겪으면서 풍성한 이야깃거리를 남기기는 하였지만, 총체적으로는 성공도 실패도 아닌 어정쩡한 상태로 끝났다. 결국 음질과 귀를 울리는 만족감으로 성과를 삼아야 하는데 그게 아니었단 이야기이다.

'그런 소소한 잡음은 어차피 실제 감상 위치에서는 들리지 않는다. 약간의 잡음은 자작 진공관 앰프의 운명이기도 하다. 진공관 앰프가 내는 소리의 우월성은 잡음을 뛰어넘는 그 이상의 가치가 있다'라고 스스로를 위안하고 싶다.  그러나 잡음이 있는 앰프는 '기본이 덜 된 앰프'가 아니던가? 

출력 트랜스포머의 제작부터 헤아린다면 이번의 6V6 싱글 앰프 제작 프로젝트는 2022년부터 시작되었다(당시 작성한 글 중 하나 - 진공관 앰프용  R코어 출력 트랜스포머를 감을 준비를 하다). (1)괜한 일에 시간과 정성을 들이면서 재활용도 어려운 쓰레기를 계속 만들어 내는 것은 아닌지 문득 후회가 들 때도 있고, (2)기왕 여기까지 왔으니 더 공부하고 노력하여 완성도를 높여 보자는 욕심이 들기도 한다. 두 개의 자세 중 어느 것이 옳은지는 아직 결론을 내리기 어렵다. 어쩌면 철학적 고민이 필요한 순간인지도 모른다. 

중국제(왼쪽 끝)와 구 소련제 6V6GT 호환관. 전체를 유리로 만든 날렵한 MT관과 비교하면 이런 고전적인 진공관이 외형적으로 더 매력이 있다.


지금은 (1)의 심리 상태에 좀 더 가깝다. 가뜩이나 좁은 집구석에 자꾸 물건을 사들여서 늘여 놓는다는 것에 대해 점점 부담을 느끼고 있기 때문이다. 많은 것도 아니지만 책을 비롯하여 독립한 아이들의 짐을 조금씩 정리하면서 '단순하고 간결한 삶'을 추구해야 되겠다는 생각을 과거보다는 더 많이 하게 되었다. 만약 이러한 생각이 확고해진다면, 카메라+렌즈, 망원경, 그리고 그동안 사 모은 악기까지 정리 대상으로 삼게 될지도 모른다. 실행에 옮기게 될 경우 많은 주저함이 따르겠지만 말이다.

2024년 3월 11일 월요일

시놀로지 NAS에 이별을 고하다

2013년도에 구입하여 거의 하루도 쉬지 않고 돌던 시놀로지 DS-1512+가 드디어 제대로 작동하지 않는 상태에 이르렀다. LED의 점등 상태에 따라 정확한 진단을 내리고 적합한 조치를 취하거나 필요하다면 수리를 할 수도 있겠지만, 이제 조용히 떠나 보내기로 하였다. 어차피 5개의 드라이브 중 하나가 작동하지 않는 상태로 오래 사용해 왔으니, 이제는 전면적으로 이상 증세가 나타난들 그러려니 하고 받아들여도 될 것이다.



불용처리 신청서를 올린 뒤 내부에 들어있던 디스크 드라이브는 재활용을 위하여 빼냈다. 하드독에 물려서 USB 케이블을 통해 리눅스 워크스테이션에 연결하니 자동 마운트가 되지 않는다. 의아하게 생각했으나 그 이유는 너무나 당연하였다. 4개 드라이브로 구성된 RAID 볼륨의 일원이 아니었던가. Disks 명령어를 실행해 보니 /dev/sde1에서 /dev/sde3까지 3개의 파티션이 보인다. 이를 전부 삭제한 다음 하나의 파티션을 할당하여 ext4로 포맷을 하였다.

하드 디스크 드라이브의 재활용.


이 작업과는 별도로 Dell R910 서버의 DAS에 들어있던 자료를 옮기느라 많은 시간을 보내고 있다. Dell 서버는 작년에 전기 시설 점검을 위해 연구소 전체에 정전이 있었을 때 전원을 내린 뒤 재부팅이 되지 않는 상태가 되었다. 전산팀의 도움으로 망가진 디스크를 일부 교체하고 OS를 복구한 뒤 부서 내에서 다른 목적으로 활용하기로 결정을 내렸다. 궂은 일을 마다하지 않고 도와주는 전산팀 사람들에게는 항상 고마운 마음을 갖고 있다.

서버를 다른 용도로 쓸 예정이라서 DAS(약 100 TB 용량)는 비워 줘야 한다. NAS도 더 이상 쓰지 못하고 저장 공간이 충분한 다른 컴퓨터도 없다. 따라서 사무실의 리눅스 데스크탑에 새 디스크 드라이브를 SATA 케이블로 연결한 다음, 네트워크를 통해서 rsync로 파일을 복사하는 지루한 작업을 벌써 일주일 넘게 진행하였다. 꽤 오래전에 구입해 놓은 WD의 6 TB 빨간 딱지 NAS용 HDD(총 5개)의 비닐 포장을 뜯는 기분은 매우 유쾌하지만, 하나의 디스크 드라이브를 공간 낭비 없이 채우기 위해 잔머리를 굴려야만 했다. 각 디렉토리를 미리 tar로 묶어 놓아서 용량 파악 및 복사 작업은 비교적 용이하게 할 수 있었다.

책상 위에는 과거에 자료를 저장해 둔 것과 새것을 포함하여 40개가 넘는 디스크 드라이브가 어지럽게 널려 있다. 디스크 드라이브 더미 속에는 간혹 박물관에나 보내야 할 IDE 드라이브도 보이고, 1 TB짜리 저용량 드라이브도 있다. 6 TB 이후로는 디스크 드라이브를 직접 구매해 본 일이 없으니 요즘은 어떤 수준의 디스크 드라이브가 대세인지도 잘 모르겠다.

새 사무실로 들고 온 뒤 화면이 나오지 않는 데스크탑 서버가 한대 더 있다. 이것을 또 어떻게 해야 할런지... 또 전산팀 인재들에게 SOS를 보냈다.

전자기기의 노화와 사람의 노화를 생각해 보았다. 어제 사무실을 방문했던 이성훈 박사께서는 특히 영양제와 안티에이징에 대하여 관심이 많다며 하바드 의대의 데이비드 싱클레어 교수가 복용하는 영양제에 대한 설명을 해 주었다.

기술 발전에 기대는 것보다는 노화를 대하는 우리의 자세가 더 중요하다고 생각했던 나로서는 매우 신선한 소식이었다. 시간이 된다면 마이클 스나이더가 밝힌 노화 경로에 관한 연구 성과도 공부를 해 봐야 되겠다.

2024년 3월 10일 일요일

반도체 앰프 정리하기

스트레스가 쌓일 때면 납땜인두를 든다. 그래서 내 주위에는 만들다가 제대로 완성하지 못한 자작품들이 즐비하다. 이렇게 질서 없이 늘어만 가는 물건들이 또 스트레스를 유발한다. 남은 부품으로 또 무엇인가를 만들어야 한다는 강박관념에 부품들을 사 모으고, 그렇게 만들어진 자작품의 성능이 항상 마음에 드는 소리를 내는 것도 아니다. 

총 두 차례에 걸쳐 3년 반의 기간 동안 외부에 파견 근무를 다녀 오면서 짐을 들고 다니는 일을 되도록 하지 말야야 되겠다는 생각을 갖게 되었다. 남들보다 훨씬 적은 회수의 이사를 다니면서 할 말은 아니겠지만 말이다. 일반적으로 집을 키워 나가는 기회를 잘 포착하는 사람들이 이사를 많이 하게 되니, 그렇지 못했던 나 자신에 대해 반성을 하는 것이 더 나을 것이다. 

활용도가 현저히 떨어지는 자작 앰프는 과감히 그 수를 줄이기로 결심을 하였다. 보드만 구입하여 케이스에 대충 넣어 아주 가끔씩 사용하던 반도체 앰프 두 개 - 각각 TDA7265 및 SI-1525HD를 증폭 소자로 사용 - 중 하나를 없애기로 마음을 먹었다. 두 앰프 모두 좋은 점과 부족한 점이 있다. 내가 가장 처음 구입했던 토로이덜 트랜스포머(dual 0-18V, 100VA, 2015년 구입)를 활용함과 동시에 희소성 측면에서 Sanken의 SI-1525HD IC를 이용한 앰프를 소장하는 것으로 결정하였다. 

앰프 케이스는 원래 TDA7265 앰프 보드가 들어 있던 것으로, 대전에 위치한 업체인 케이스포유에서 구입했었다.



이 케이스에는 워낙 여러 종류의 앰프 보드가 입주와 퇴거를 반복하였다. 지금은 알루미늄 속판이 있어서 주요 부품을 그것에 직접 고정하지만, 초기에는 케이스의 바닥면에 직접 구멍을 뚫었었기에 가공 흔적이 요란하게 남아 있다. 오늘도 PCB 고정용 구멍을 알루미늄 속판에 새로 뚫었지만 위치를 정확히 맞추지 못하였다.


은포전자에서 2016년에 구입했던 SI-1525HD 앰프 보드(당시 작성한 글 링크)에 대해서 좋은 말만을 하기는 쉽지 않다. PCB의 동박이 너무 약해서 40와트급 인두로 작업을 하다가 떨어져 나간 곳이 있기 때문이다. 또한 잡음의 문제도 있는데, 이는 내가 배선을 지혜롭게 하지 못한 것에서 기인하는지도 모른다. 회로의 그라운드를 220V 콘센트의 접지에 연결함으로써 잡음을 완벽히 없애게 되었지만, 원래는 이렇게 하지 않아도 잡음은 발생하지 말아야 한다. 

내가 아무리 앰프나 스피커 시스템을 직접 만든어 봐야 기성품 수준으로 튜닝이 된 상태에 이르기는 어렵다. 그것이 아무리 저렴한 기성품이라 해도 말이다. 물론 세상에는 기성품을 능가하는 수준의 오디오 자작을 하는 고수가 많이 있지만, 나 정도의 공부와 시간 투자로는 그런 수준에 이르게 될 것 같지가 않다. 조금씩 정리를 해 나가려는 이유의 2/3 정도는 바로 이런 데 있는 것이다. 

아마추어의 한계를 인정하는 일! 그것이 참 어렵다. 내가 직업으로서 하는 일에 대해서도 이럴 수 있을까? 되는 것도 없고 딱히 안 되는 것도 없는 현실에서 많은 무력감을 느낀다. 판을 흔들려는 '입 큰 사람'들에 대해 뭐라고 대항을 해야 되는데, 그것이 쉽지 않다. 단 한 차례도 그런 삶을 살아야 한다고 생각해 온 적이 없이 없었고, 바로 작년까지는 그럴 일도 전혀 없었기 때문이다. 특히 주변의 많은 사람들이 나에게서 그런 역할을 기대하는 것 같아서 더욱 힘들다. 

"어? 아직 얼굴이 괜찮으시네요?"

이런 말을 들으면 겉으로는 웃지만 속으로는 썩은 미소를 짓게 된다. 아니, 그러면 내가 새로 맡은 일이 너무 어렵고 복잡하여 스트레스가 많은 것이라서 지금쯤이면 얼굴이 흙빛으로 변해 있어야 한단 말인가?  

그래서 퇴근하고 돌아오면 기타를 매만지거나 공구함부터 열게 되는지도 모른다.

최근에 본 영화에서 인상에 남는 대사가 있어서 기록해 본다. 요즘의 나에게 아주 잘 어울리는 말이다.

  • 당신의 영향력을 과대평가하지 마세요('위스키 탱고 폭스트롯')
  • 인생에서 통제할 수 있는 것은 네가 인생을 대하는 자세뿐이다('브라이언 뱅크스').

그래도 아직 몸에서 이상 신호가 느껴지지 않는 것은 다행이 아닐 수 없다. 인생을 살아 오면서 알게 모르게 내성을 많이 키워 온 때문일 수도 있고, 음악이나 오디오 기기 자작이라는 나름대로의 스트레스 해소법이 있기 때문일 수도 있다.

6V6 SE 앰프의 드라이브 스테이지를 개선하는 일과 낡은 거치형 시디 플레이어의 택트 스위치를 교환하는 일 정도가 올해 오디오 자작과 관련한 목표이다. 공간을 차지하는 그 무엇인가를 계속 들이는 일은 자제하도록 하자.



2024년 3월 6일 수요일

All of Us 간단히 들여다보기 - 참여자가 아닌 연구자 측면에서

2018년부터 시작된 미국 NIH의 All of Us Program은 All of 'United States (of America)'를 뜻하는 것일지도 모른다고 장난스럽게 생각해 본 일이 있다. 미국 시민권을 갖고 있는 사람으로 참여자를 한정했는지는 모르겠지만, 유전체 의학 연구에서 상대적으로 적게 대표된 인종을 All of Us에서는 많이 포함하려고 노력한 것은 사실이다. 신수용 카카오헬스케어 연구소장의 블로그에서 All of Us 현재 상황이라는 글을 보고 뒤늦게 공부를 시작해 본다.

작년 8월에 315,000명에 대한 데이터 공개 현황을 소개한 논문이 Patterns라는 저널에 실렸다. Patterns라.... 매우 생소한 저널이다. Cell Press에서 출판하는 오픈 액세스 저널로서 'We're all about sharing data science solutions to problems that cross domain boundaries'라고 하였다. 논문의 제목과 링크는 다음과 같다.

The All of Us Research Program: Data quality, utility, and diversity

Highlights

  • The All of Us Research Program has released data for over 315,000 participants(참여자의 49%는 비백인)
  • Demonstration projects support the utility and validity of the All of Us dataset
  • The cloud-based Researcher Workbench provides secure, low-cost compute power.

In brief

The initial release of the All of Us Research Program data reflect diverse participants with broad information, reproduces known associations, and provides rich opportunities for research. The dataset and tools form a strong foundation for cohort growth and future research, advancing the program mission to improve human health and advance precision medicine.

이 논문의 article type은 descriptor에 해당한다. 



흥미로운 것은 data science maturity (level)라는 것을 정의해 놓았다. 이 논문은 level 4에 해당한다. 그러나 웹사이트 안에서는 DSML의 5개 레벨에 대한 설명이 보이지 않았다. 아마 실제로 투고를 위해서 로그인을 한 경우에는 저자가 DSML을 적절히 결정하여 입력하도록 되어 있을 것이다.



Data science maturity의 의미를 구글에서 찾아보다가 가트너가 주창한 analytics ascendancy model 및 data maturity model이라는 것도 알게 되었다(링크). 이 개념이 Patterns라는 저널의 data science maturity와 어떤 관계가 있는지는 잘 모르겠지만...

그림 출처:  COMPUTD - 4 levels of data maturity.


All of Us Research Program 은 참여자를 위한 웹사이트와 연구자를 위한 리서치 허브, 그리고 프로그램 공식 소개 웹사이트로 잘 구분되어 정보를 공개하고 있다. 우리나라에서 곧 출범할 예정인 국가 통합 바이오 빅데이터 구축사업('국통바빅' 또는 '국바빅'이라고 줄여서 부름; 정식 명칭과 영문 명칭도 조만간 결정해야 함)에서도 그런 준비가 되고 있는지 살펴 볼 일이다.

이 논문에서 보고한 과학적 분석 결과는 우울증 및 제2형 당뇨병의 인종적 약물 사용 패턴 차이, 흡연과 알려진 암 연관성 검증, 그리고 알려진 인종 효과에 따른 심혈관 위험 점수 계산의 세 가지이다. 그러나 Research Projects Directory에 등록된 진행 중인 연구는 오늘 기준으로 무려 9,589개나 된다. 

국통바빅이 추구하는 것은 이렇게 9,589개나 되는 연구가 활발히 이루어지도록 양질의 바이오 빅데이터를 제공하는 것이다. 9,589개의 데이터 활용 연구 자체를 위한 연구비 지원을 하는 것은 분명히 아닌 것으로 나는 이해하고 있다. 물론 어떤 형태로든 데이터 활용 연구 지원 사업이 조성될 가능성은 있을지도 모른다. 이에 대해서 많은 사람들이 궁금해 할 것은 당연한데, 나도 더 이상은 알지 못한다.

데이터 접근은 다음의 3개 tier로 나뉘어 서로 다른 레벨로 이루어진다(Data Access Tier). Registered/controlled tier의 접근을 위해서는 연구 프로젝트에 대한 설명을 제출해야 한다.

  • Public tier(login 불필요): 식별자를 제거한 군집 형태의 데이터셋. Data SnapshotData Browser를 통해 누구든 접근 가능하다.
  • Registered tier(login 필요): 개인 수준의 데이터를 포함하고 있으며, Research Workbench를 통해 승인된 사람만 접근 가능하다. Electronic health record(EHR), 웨어러블, 조사, 신체 계측 자료 등이 포함된다.
  • Controlled tier(login + 추가적인 승인 필요): whole genome sequencing과 genotyping array 잘 등이 포함된다. 
접근 자격을 얻는 상세한 방법까지는 조사하지 않았다. How to Register 웹사이트를 방문해 보면 먼저 연구자의 소속기관 차원에서 Data Use and Registration Agreement(DURA)를 받아야 한다. 워크벤치의 계정을 개설하는 것은 그 다음이고, 필수 트레이닝을 이수한 다음 Data User Code of Conduct(DUCC, PDF 파일)를 받아야 한다. DUCC는 매우 중요한 문서이므로 꼼꼼이 줄을 쳐 가면서 읽어야 할 것 같아서 종이에 인쇄를 해 놓았다. Data Access Framework도 중요한 정보이다. 단, 이 문서는 2021년 8월에 최종판(v1.1)이 나왔다.

Registered/controlled tier 전부 기관생명윤리심의위원회(IRB)의 승인을 거쳐야 할까? Controlled tier는 당연히 그럴 것 같다. FAQ 항목 중에 이에 대한 내용이 있다(아직 상세하게 읽어보지는 않음). 그런데 Data Access Framework에 의하면 10쪽에 이런 내용이 있다.

The research that occurs within the Workbench is not restricted to IRB review or approval. Users may be bound by institutional policies governing research, which may include local IRB review.

우리나라의 국통바빅 시범사업에서는 폐쇄 전산망 내의 분석 시스템에서만 해당 자료를 이용해야 한다는 것이 불문율이었다. 국통바빅 본사업도 아마 그런 형태인 것 같다. (민간)클라우드를 쓰면 안 되나? All of Us에서는 이미 안전하고 능률적이었음이 입증된 플랫폼인데?

국통바빅 본사업을 준비하는 과정에서는 참여자에게 받아야 하는 동의서(동의서를 '구득'한다는 어려운 표현을 사용함)를 면밀하게 준비하느라 많은 정성을 쏟은 것으로 알고 있다. 이 동의서는 인체유래물(이렇게 표현해야 유전체 및 오믹스 정보가 포함된다)을 이용한 연구의 정당성을 확보할 수 있기 때문이다. 이것이 전부는 아니고, 나머지 절반은 IRB 심의가 칼자루를 쥐고 있다.

반면 All of Us의 DUCC는 매우 단순명료하다. 참여자의 정보를 누설하거나, 재식별하지 않겠다는 다짐을 받는 정도이다. 식별자를 분리하여 보관하고, 인터넷이 연결되지 않은 컴퓨터에서만 작업해야 하며... 이런 것들을 일일이 규정으로 만들어서 승인을 받지는 않는 것 같다. 심지어 외국인 연구자는 접근하지 못한다는 제한 같은 것은 없다. 심층적으로 들여다 보면 조금 더 까다로울지도 모르겠지만, 상당히 '열린 정책'이라는 점은 분명하다. 우리나라에서 이렇게 해 보자고 강하게 주장하면 아마 뚜껑이 열릴 분이 많을 것이다. Data Access Framework 2쪽에 다음과 같이 가슴 속을 후련하게 해 주는 선언이 있는 것을 참고하도록 하자.

  • No restrictions are placed on the use of All of Us resources to develop commercial products and tests to meet public health needs. All of Us claims no intellectual property rights on such commercial products developed from research use of All of Us data.
  • All of Us resources should be accessible to users around the world regardless of country of origin, although the access process may be modified to allow appropriate user authentication.

합리적이고 간결하면서도 개방적인 정책 위에 과학과 정밀의학, 맞춤의료가 꽃을 피울 수 있음은 자명하다. 우리나라의 국통바빅 본사업도 그렇게 되었으면 정말 좋을 것이다.

NCBI의 Genome & Assembly는 5월을 끝으로 사라지며, Datasets 서비스로 재편된다

자료 정리를 위해 예전에 NCBI에 등록했던 미생물 유전체 정보를 둘러보았다. 언제 등록을 했는지 기억도 하기 어려운 자료들이 점점 많아진다. 내 손으로 등록했던 것 중에 최초(Hahella chejuensis KCTC 2396; GenBank accession CP000155.1 또는 assembly accession GCA_000012985.1; 등록일은 2005년 10월 18일), 그리고 특별히 사연이 많았던 것 외에는 언제 등록을 했는지 기억하기 어려운 것도 점점 많아진다. Submission 단계에서 정보를 채워 넣다가 중단한 것도 여럿 존재한다.

Bacterial genome sequence 하나로 논문 하나를 쓰던 시절은 이미 오래전에 사라졌다. Announcement라는 형태의 출판물도 있지만 그것은 예외로 하고... 사실 나도 이런 형태의 출판물을 많이 만들어 왔었다.

논문화까지 성사되지 못한 유전체 정보라서 가치가 없는 것은 절대로 아니다. 누군가는 이것을 왕창 긁어 모아서 새로운 발견을 하는데 유용하게 쓰기도 하니까 말이다.

NCBI Assembly 웹페이지에서 이 서비스가 조만간 종료된다는 공지문을 발견하였다.



Learn more를 클릭하면 다음과 같은 NCBI Insights의 공지문으로 연결된다.

NCBI Datasets: Easily Access and Download Sequence Data and Metadata - Effective May 2024, NCBI Datasets will replace legacy Genome and Assembly web resources

왜 이렇게 개편하였는가? 유전체, organism, 유전자 정보를 통합하여 제공하고, 대용량 데이터셋을 가져가기 용이하게 하며, 데이터와 메타데이터를 한꺼번에 취급하고, 유전체 데이터셋에 대한 단일한 진입구를 제공하기 위함이라고 하였다.

하나의 생물종에 대해서 reference 유전체 서열 말고는 참조할 것이 별로 없던 시절에는 NCBI의 Assembly 웹페이지를 열람하거나, 심지어 GenBank 파일의 헤더 영역을 직접 열어서 누가 언제 이 정보를 만들어서 올렸는지 확인하는 것이 가능하였다. 그러나 지금은 미생물 단일 종에 대해서 많게는 천 개가 넘는 균주의 유전체가 등록되기도 하고(특히 병원체의 경우), 심지어 동일한 균주라 해도 이를 보유하고 있는 개별 연구자가 별도로 유전체 해독을 하여 등록하기도 한다. NCBI의 정책 변경은 점점 많아지는 데이터를 관리하고 제공하기 위한 오랜 고민과 노력의 필연적인 결과일 것이다.

NCBI Datasets을 처음 사용한 것은 아마 SARS-CoV-2의 유전체 자료를 한꺼번에 가져올 때였던 것으로 기억한다. 처음에는 약간 어색하였지만 이내 익숙해졌다. 당연히 명령행 환경에서 Entrez Direct(EDirect)를 이용하여 batch process로 자료를 가져와야 한다는 고정관념을 깬 계기가 되기도 하였다.

지금까지 알려진 모든 생명체의 유전체 정보는 이처럼 NCBI가 블랙홀처럼 빨아들이고 있다.  중국 등지에서 더 많은 정보를 생산하고 보유한다는 이야기는 많이 들려오지만 정보의 개방성 측면에서는 NCBI를 따를 수가 없다. 한국(KOBIC)은 무엇으로 경쟁력을 갖추어야 할지 고민스럽다. 이 광대한 정보의 호수(바다?)에 돌 몇 개를 던져서 수면이 단 1 cm라도 올라가는 일이 생길 수 있을지? 아니, 단 1 mm라도...

2024년 3월 5일 화요일

2년 만에 켠 Xubuntu 데스크톱

대전 집으로 돌아오고 나서 한달이 훨씬 더 지나서야 인터넷 이전 설치를 완료하였다. 가족들 모두 얼마 되지 않는 데이터 요금제를 쓰면서 휴대폰으로만 인터넷 접속을 하느라 고생이 많았다. 2022년 여름 이후로 켜지 않았던 Xubuntu 데스크톱에 전원을 넣고 업데이트를 하였다. Intel Core i5(7세대)를 기반으로 돌아가는 Dell Inspiron 3668(2017년 구입)은 어떻게 해야 할지 나도 잘 모르겠다. 느리기로 말하자면 둘째가라면 서러울 데스크톱이기 때문이다. 인터넷 이전 설치 직전에 PC 초기화를 해 보았으나 별로 가벼워지지는 않은 것 같다. 앞으로 집에서는 데스크탑의 활용 빈도가 점점 떨어질 것 같다. 대부분의 작업은 노트북 컴퓨터로 해결할 가능성이 크다.

덩달아서 볼루미오도 다시 Wi-Fi 환경을 만나서 음악을 들려주고 있다.

Xubuntu의 Xfce 환경을 오랜만에 만났다. 패키지 업데이트도 완료하였다. 아직은 Ubuntu 22.04 LTS 상태이다. 개인 사용자에 한해 총 5대의 컴퓨터에 대하여 LTS 보안 업데이트를 10년까지 무료로 제공하는 Ubuntu Pro라는 것도 요즘 새롭게 알게 되었다.



Xubuntu가 설치된 이 데스크톱 컴퓨터는 Intel Xeon E5520(2.27GHz)를 기반으로 돌아간다. 메인보드는 Supermicro X8SAX. Inspiron 3668과는 비교가 되지 않을 정도로 빠르다. 전원장치 등 주변장치만 잘 버텨 준다면 앞으로 계속 사용하는데 문제가 없을 것이다. 이따금 집에서 리눅스 환경이 필요하다면 이 컴퓨터로 충분할 것이다. 여기에 Waveform FREE를 설치해서 다시 음악 작업을? 어휴, PulseAudio와 JACK과 더불어 씨름했던 몇년 전의 일을 떠올리면 다시 그런 도전에 직면하고 싶지는 않다. 

중고로 구입한 사운드 블라스터 Live!가 어디로 갔더라...