2026년 3월 19일 목요일

자작 진공관 앰프의 전원 스위치 교체하기

자작 43 power pentode SE amplifier의 전원 스위치 고장과 관련한 글은 지난주에 쓴 일이 있다(링크). 납땜이 아닌 커넥터 체결 방식으로 바꾸기로 하고 알리익스프레스에서 부품을 주문하여 어제 받았다. 점심 시간을 이용하여 부품 교체를 완료하였다.


사무실 책상 앞에서 조용히 듣기에 이보다 좋은 소출력 앰프가 없다. 요즘 저렴한 블루투스 앰프가 많지만, 빨갛게 달아오른 진공관의 히터를 눈으로 보는 재미를 무엇이 대신할 수 있을까?


커넥터 작업 전용 크림핑 툴을 살 때에는 '자주 쓰지도 않을 공구를 사는게 옳은가'하고 항상 고민을 한다. 수공구 중에서는 가격이 꽤 나가기 때문이다. 그러나 깔끔하게 마무리된 작업 결과를 보면 만족도는 그 이상이다. 확실히 체결되고, 나중에 수리하기에도 좋고. 이는 아두이노 자작에서도 마찬가지.

부서진 식탁용 의자도 고쳐야 하는데... 여러 DIY 중 제일 하기 싫은 것이 목공과 도색이다. 왜? 잘 못하니까! 잘 하지 못하니까 자주 하지 않게 되고, 몸이 기억하지 못한다. 아주 드물게 냄비밥을 지으면서 꽤 잘 되었다고 만족하지만 결코 기억에 남지 않는 것과 비슷하다. 

2026년 3월 18일 수요일

라즈베리파이 3B에서 3.5인치 TFT 터치 LCD 작동시키기

라즈베리파이(이하 Pi로 표기) 3B에서 Volumio를 구동하던 시절, 3.5인치 TFT LCD(480x320)를 달아서 조작용으로 쓰려고 노력하던 때가 있었다. 휴대폰 앱으로 제어하면 되지만 반응이 늦거나 연결이 잘 되지 않는 문제가 종종 발생하기 때문이다. Pi의 공식 디스플레이는 아마 HDMI로 연결되는 7인치 LCD일 것이다. Pi의 GPIO 소켓에 그대로 꽂아서 쓸 수 있는 SPI(Serial Peripheral Interface) 방식의 3.5인치 중국산 TFT LCD는 구동시키기가 매우 까다로운 것으로 유명하다. 작년 여름에 온갖 시도를 다 해 보았으나 터치 좌표를 도저히 맞출 수가 없어서 포기하고 말았다. 관련 기록은 여기에 있다.

음원 파일 재생기로 쓰던 Pi는 2026년에 접어들면서 사운드폰트를 이용하는 소프트웨어 신시사이저인 FluidSynth 구동용 기기, 곧 ‘Fluid Ardule(= Fluidule)’로 변모하고 있다. 처음에는 사운드 캔버스를 본뜬 Fluid Canvas라는 이름도 고안했으나, 지금은 Fluid Ardule 쪽으로 기울고 있다. 

조작은 USB-serial로 연결한 아두이노(우노)에서 버튼과 인코더를 사용하여 실시할 예정이다. 조작을 위한 디스플레이는 아두이노에 연결된 1602 LCD가 될 것이다. 그러나 여기에서 보이는 정보량은 너무나 적다. 그래서 상태 표시용으로 Pi에 3.5인치 LCD를 다시 달아보기로 하였다. 터치 입력 기능은 일절 사용하지 않고, 단지 1초 정도의 간격으로 작동 상태를 보여주는 것으로 기능을 제한하였다.

이것 역시 쉽지 않았다. Raspberry Pi OS는 계속 발전하는 반면, 중국산 3.5인치 TFT LCD에 대한 드라이버 지원은 예전과 같지 않기 때문이다. LCD-show라는 드라이버 스크립트 모음이 꽤 쓸 만한 것으로 알려져 있고 작년에도 이를 사용했었다. 그러나 시스템에 뭔가 ‘침습적’인 흔적을 남기기 때문에 커널 업데이트 등에 대응하기 어렵다고 한다. 이미지나 동영상을 빠르게 재생할 것이 아니기 때문에 LCD-show를 쓰지 않는 단순한 방법을 알아본 끝에 겨우 성공하였다. 다음은 ChatGPT로 만든 부팅용 스플래시 이미지를 표시해 본 것이다. 전체 과정은 별도 위키 문서인 Raspberry Pi OS Installation and Optimization에 정리하였다.

Fluid Ardule boot splash image
액체 방울 속의 MIDI 커넥터. 원본 이미지 링크.

MIDI 주변기기를 Fluid Ardule에 연결하여 사용하거나 오디오 파일을 재생하는 기본 테스트는 전부 마친 상태이다. 아두이노를 이용한 조작반이 완성되면, Fluid Ardule에서 불필요한 기능을 없애야 한다. 그래야 부팅 시간도 빨라지고 FluidSynth 작동도 원활해질 것이기 때문이다. 목표 부팅 시간은 10초. 불가능하지 않다고 하니 시도할 가치는 충분하다.

아직은 Fluid Ardule에 키보드와 HDMI 모니터를 연결하여 직접 명령어를 입력해야 한다. HDMI 기능을 무력화시키면 Wi-Fi를 통한 SSH 접속을 해야 한다. 만약 네트워킹 기능까지 죽인다면 시리얼-USB 통신을 해야 한다(맞는 케이블 필요; 윈도우측의 드라이버 호환성 때문에 FTDI나 CP210x 칩 사용 제품 추천). 시스템 자원 소모를 극도로 줄인 통신 방법이라고 할 수 있다. 그런데 TFT LCD가 모든 GPIO 핀을 가리고 있어서 통신에 필요한 RX(10)/TX(8) 핀에 접근하기가 너무 나쁘다. 실제로 TFT LCD의 구동에 필요한 핀은 몇 개 되지 않지만, 2x13개의 핀 자리를 차지하고 있는 것이다.

GPIO 1-26 pins blocked by TFT LCD header socket
LCD 모듈의 핀헤더 소켓이 GPIO 1~26번 핀을 가리고 있다. 아래 사진에서 맨 오른쪽 핀이 2번이며, 1번은 안쪽에 있다.

다음 이미지와 같은 아이디어 상품도 있지만 가격이 꽤 비싸다. 케이블로 연결하는 GPIO expansion board라는 것도 존재한다.

GPIO extender product
그림 출처: Geekworm

가장 간단한 방법은 Pi 보드 뒷면에서 납땜을 하여 필요한 선 세 가닥을 따는 것이다. 아두이노 우노에서도 이런 짓을 하더니(관련 글 링크), 드디어 라즈베리 파이까지 손을 대게 되었다.


2026년 3월 19일 업데이트

라즈베리파이 3B에서 사운드를 설정하고 FluidSynth를 활용하는 방법을 별도의 위키 문서인 Raspberry Pi OS Installatio and Optimization에서 작성해 나가고 있다. 앞으로 아두이노 우노를 이용한 조작반 제작과 펌웨어 설계, 그리고 라즈베리파이의 부팅 속도 향상 등 할 일이 많다. 케이스는 또 어떻게 할 것인가?

이 작은 부품 하나가 많은 상상력과 영감을 불러 일으킨다.



2026년 3월 15일 일요일

주말 부안 나들이 - 내소사, 슬지네 제빵소, 채석강

능가산 내소사에는 사운드 디렉터가 일하고 있음에 틀림이 없다. 그렇지 않고서야 고요한 산사의 분위기에 이렇게 절묘하게 어우러지는 두 갈래의 소리를 BMG으로 '믹스'해 넣을 수는 없을 것이기 때문이다. 다음 동영상에서 파트 1(지장암)은 고요한 풍경 소리의 하모니, 대략 9초부터 나타나는 파트 2는 소망의 왁자지껄한 아우성에 해당한다.


일주문으로 들어서서 전나무길을 따라 걷다가 길 오른편으로 '지장암'이라 써 있는 안내판을 발견하였다. 초입에는 누군가 멋들어지게 지은 한옥이 있었고, 산으로 오르는 길목에는 작은 대나무 숲이 있었다. 지장암까지 올라가 보기로 하였다. 드물게 찾아주는 이를 반기듯 대나무숲이 끝나는 언덕에는 홍매화 한 그루가 예쁘게 꽃을 피우고 있었다. 

올라가 보니 최근에 지은 건물들이지만 주변에 마치 작은 정원을 꾸민 것 같이 아기자기하고 아름다운 모습이었다. 주 전각은 최근에 지어진 서래선림. 일반적인 사찰 전각이 아니라 수행 공간이다. 찾는 이도 거의 없었고, 아름다운 풍경 소리를 들으며 아내와 나는 산사의 고요함을 마음껏 누렸다.




이곳의 이름은 '소리정'. 바로 곁에서 바람에 흔들리는 청아한 풍경 소리를 들으라는 뜻이렸다.

다시 전나무길로 들어서 내소사 법당을 찾아간다. 천왕문을 지나 봉래루로 접어드려는데 '다다다닥~' 독특한 소리의 집합이 들려온다. 도자기로 만든 작은 풍경 모양의 것에 소원을 적은 나무패를 달아서 나무와 건물 주변에 잔뜩 걸어 놓은 것이었다. 오, 이는 누구의 아이디어란 말인가. 연주회 직전, 자리에 앉은 오케스트라 단원들이 지휘자가 나오기를 기다리는 짧은 시간 동안 저마다 막바지 연습을 하면서 내는 기대감 넘치는 불협화음을 연상시켰다.


봉래루.


내소사 대웅보전은 보물 제291호이다. 내부의 우물천장과 조각은 빛이 많이 바랬지만 무척 화려하다.

 

기록을 찾아보니 대략 2년에 한번 꼴로 부안을 찾았었다. 그럴 때마다 내소사의 새로운 아름다움을 발견하는 것 같다. 



주차장에서 여유롭게 담배를 피우다가 국립공원 관리원에게 적발되는 사람을 보았다. 아무리 전자담배라 해도 흡연구역을 이용해야지! 액상형 전자담배를 포함한 모든 종류의 니코틴 함유 제품을 담배로 규정하는 담배사업법 개정안은 4월 24일부터 시행한다고 하였다. 계도 수준인 건지 실제로 '딱지'를 발급한 것인지는 잘 모르겠으나. 참고로 국립공원은 전 구역이 흡연 금지 구역이다. 주차장도 마찬가지.

다음으로 찾은 곳은 곰소 염전 곁의 슬지네 제빵소. 이 지역의 명소이고 인터넷을 통해서 꽤 많이 알려졌다고 한다. 떡인지 찐빵인지 구별이 어려운 찰진 커다란 빵에 크림이나 콩 종류가 가득한 빵의 질감과 맛이 독특했다. 우리밀을 100% 사용하고 지역에서 나는 천일염을 사용한 가염버터를 사용한다고 하였다. 

인스타그램 게시용으로 잘 어울릴 인테리어와 주변 풍경, 그리고 이야기를 담고 있는 것은 좋으나 내외부 치장과 '서사'가 좀 과대하다는 느낌이 들었다. 전통과 상생을 강조한 것은 좋으나 이 빵집이 원래부터 이 염전 근처에 있었던 것은 아니었고, 이러한 사실은 나중에 인터넷을 검색해 보고서야 알게 되었으니 말이다. 물론 가업을 잇기 위한 현 대표의 전공을 접목한 노력이 들어간 것임은 부인할 수 없겠으나... 잘못하면 지역 빵집과 자본의 콜라보라고 오해하기 쉬울 것 같았다.



이곳이 곰소 염전이다.





부안, 즉 변산반도국립공원에 왔다면 채석강을 들르지 않을 수 없다. 변산반도의 서남쪽 해안을 따라 시계방향으로 달린다. 바다 건너 고창군이 손에 잡힐 듯 보인다. 채석강에 이르러서는 물때를 잘 만난 덕분에 짠 바다 내음을 맡으며 바닷가 층암절벽을 따라 걸으며 주변 풍광을 마음껏 감상할 수 있었다.



마치 수천 권의 책을 쌓아 놓은 것 같은 채석강은 약 7천만년 전 백악기에 쌓인 퇴적 지층이라고 한다. 안동 하회마을을 내려다볼 수 있는 부용대(2025년 3월 여행 기록 링크) 또한 독특한 최적 지층이다.

이번 주말 여행은 아내의 특별한 생일을 기념하기 위함이었다. 낙조를 감상하면서 새만금 방조제를 달려 군산을 거치거나, 혹은 전주에 들러서 저녁식사를 한다면 더욱 완벽한 일일 여행 코스가 되었으리라. 

 

2026년 3월 12일 목요일

방어적 글쓰기(커뮤니케이션)의 몇 가지 기술

방어는 과거에 받은 공격의 기억에서 온다. 그것은 생존 본능이다. 특허 명세서나 법원 판결문처럼 극도로 방어적인 문서들도 결국 같은 원리에서 만들어진다.

글쓰기는 정보나 감정을 전달하는 것이 원래 목적이다. 조직에서 만들어 내는 많은 문서는 겉으로는 정보를 전달하는 것 같지만, 결국은 책임을 관리하기 위한 것이다. 이런 목적에서 안전하게 글을 쓰는 방식을 방어적 글쓰기라고 불러 보자.  '세 시간 내로 보내 주세요'와 같은 갑(甲)의 요청에 대응하는 것은 글쓰기가 아니라 작성된 글을 전달하는 기술에 해당하지만, 이것도 포함하여 논하기로 한다.

첫 번째 기술은 매우 널리 통용되는 것으로, 제출 시한에 임박해서 보내기이다. 표면적으로는 작성에 공을 들이느라 이렇게 되었다고 변명하지만, 대부분의 경우 다 만들어 놓고도 일부러 늦게(그러나 기한 내에) 보내는 것이다. 문서를 너무 일찍 보내면 검토와 질문이 이어질 가능성이 매우 높기 때문이다.

두 번째 기술은 표현을 적절히 모호하게 만드는 것이다. 상세하거나 전문적인 용어가 들어가면 추가 설명을 요청하거나 꼬투리를 잡히기 쉽다. "모든 여건을 감안해 본다면", "일반적으로", "필요하다면"과 같은 표현은 문장도 온건하게 만들고 책임의 범위도 흐려진다.

세 번째 기술은 서론을 길게 만드는 것이다. 본론에 들어가기 전 긴 배경 설명이 들어가면 읽는 사람은 핵심 메시지를 잡아채서 논쟁하기 어려워진다. 결론을 가장 나중에 말하는 우리말의 특성과 가장 잘 어우러지는 글쓰기 기법이다. 이 기술은 글이 아니라 프레젠테이션에서도 써먹을 수 있다. 그러나 너무 노골적으로 서론을 길게 끌면, '결론부터 말해봐요'라는 공격에 직면할 수 있다.

글을 요청하는 갑(甲)은 이런 기술을 구사하기도 한다. 원래 이틀 뒤에 받아도 충분한 글을 일부러 촉박하게 내일까지 달라고 요청한다. 이틀 후에 제출해도 된다는 것은 물론 철저히 숨긴다. 을(乙)이 애를 먹고 있음을 너무나 뻔하다. 이윽고 내일이 되었다. 갑은 마감 직전에 이렇게 알린다. "힘드세요? 그러면 시간 하루 더 드릴께요". 을은 갑이 어렵사리 융통성을 발휘해 준 것으로 착각하고 오히려 고마워한다.

을에게 마감일을 어떻게 통보할까? 금요일 퇴근 전? 월요일 출근 직전? 이를 결정하는 데에도 치열한 눈치작전이 벌어지고, 그 결과에 따라 을의 주말은 평온한 휴식이 될 수도 있고 초과 근무가 될 수도 있다. 주가에 영향을 미칠 만한 좋지 않은 뉴스를 금요일 오후에 내보내는 것('Friday afternoon news dump'), 인사발령을 금요일 오후에 내는 것... 다 이유가 있다. 방어적 글쓰기와 함께 엮어서 방어적 커뮤니케이션 전술이라고 불러도 되겠다.

전형적인 방어적 글쓰기 사례는 뭐가 있을까? 보험 약관, 특허 명세서, 법원 판결문, 감사 대응 보고서, 기업의 리스크 공시, 의료 동의서/임상시험 설명문, 계약서 등.

이러한 기술을 너무나 잘 알고 있으며 업무 중 매우 이를 적절하게 구사하고 있는 당신은? 자랑스러워하지 말라. 조직 혁신의 측면에서는 매우 어두운 곳에 속한 사람일지도 모른다.

2026년 3월 11일 수요일

자작 43 power pentode 진공관 앰프의 망가진 전원 스위치 관련 정보 알아보기

자작 43 power pentode SE amplifier의 망가진 전원 스위치의 작동 현황 동영상을 살펴보자. 매일 작동하지도 않는 조건에서 겨우 5~6년 정도 사용했는데 벌써 망가진다니 몹시 실망스럽다. 



패널에 뚫은 스위치 고정용 구멍은 원형이었나, 혹은 사각형이었나? 상판 설계 당시 LibreCAD로 그렸던 도면을 찾아서 살펴보았다. 직경 20.3mm의 구멍을 그린 것으로 보아 직경 20mm의 스위치를 썼던 것으로 여겨진다. 이런 종류의 램프형 스위치(원형)는 매우 구하기 쉽다. 


2020년에 이맘때에 그린 도면에는 직경 20.3mm의 구멍을 뚫어서 전원 스위치를 고정했었다. 


사실 보다 정확하게는 다음과 같이 가공을 했어야 한다. 원주 양쪽에 사각 홈을 파도록 도면을 그리려면 조금 더 성가시다.

자료 원본 출처는 여기.

교체의 편의성을 생각한다면 전원 스위치의 단자에 전선을 납땜하는 것보다 납작한 모양의 압착형 커넥터를 쓰는 것이 더 나을 것이다. 한국에서는 흔히 PG (암)단자라고 하는데 정식 영문 명칭은 스페이드(spade, 날이 넓적한 삽) 단자라고 하는데, 실제 세계에서는 여기에 물리는 male 단자가 삽 모양에 더 가깝다.

절연체의 색깔은 연결에 사용할 전선의 굵기를 나타낸다.


일반적인 전원 스위치의 단자에 맞는  PG 단자의 규격(폭)은 4.8mm인 것으로 파악되었다. 오늘도 알리익스프레스에서 약간의 쇼핑을 해야 되겠다.

2026년 3월 10일 화요일

시름이 깊어질수록 회로도의 완성도는 높아지고...

오늘의 (Nano Ardule for) FluidCanvas의 회로도는 더욱 완성도가 높아졌다. 이를 가능하게 만드는 추진력은 업무 스트레스! 회로 설계를 마친 뒤 심야 달리기까지 하고 오면 머리가 맑아지고 선한 생각으로 가득 차는 것 같다.


어제까지는 패널용 MIDI IN/OUT 커넥터(DIN-5, female)를 쓸 생각이었다. 그러려면 기판에는 별도의 커넥터가 필요하다. 하지만 PCB에 직접 고정하는 DIN-5(180도) 커넥터를 쓰면 제작이 훨씬 쉽지 않겠는가? 대신 기판 면적은 훨씬 많이 차지하는 부작용은 감수해야 한다. 아두이노 나노의 RX/TX 핀과 MIDI IN/OUT 회로를 잇고 끊을 때에도 스위치가 아니라 3핀 헤더와 점퍼션트를 쓰기로 하였다. 단순한 것이 최고다. 회로도를 수정하고 전기적 연결이 완전한지를 알아보기 위해 Electrical Rules Check를 마쳤다. 

그러나 KiCad 기본 라이브러리에는 PCB용 DIN-5 커넥터(horizontal)의 부품 심벌은 있지만 footprint가 없다. 현재 기본 배포되는 것은 DIN41612 커넥터의 그것만 포함한다. 인터넷에서 검색을 통해 찾은 커스텀 풋프린트는 기판에 수직으로 고정하게 만든 것이 전부라서 별 소용이 없었다. KiCad 포럼에서는 mini DIN-3에서 DIN-8 커넥터의 풋프린트와 3D 모델을 만들어 공개한 사람도 있었다(링크).

검색을 거듭한 결과 DIN5_MIDI.kicad_mod라는 파일을 발견하였다. 정말 고마운 자료이다. 이것을 적절히 수정하면 될 것이다. 풋프린트는 top view임을 잊지 않는다면 custom footprint를 만들 때 치명적인 실수를 줄이게 될 것이다.

어두운 바탕에 찍힌 점들... LibreCAD에서 익숙하게 보던 화면이다.

위 풋프린트 그림에는 서로 다른 색깔로 표시된 세 층의 레이어가 보인다. 두꺼운 빨간색 도넛으로 표현된 것은 바로 구리로 만들어진 패턴에 해당하는 레이어다. 바로 여기에 부품의 다리가 납땜되는데, 윗면인 F.Cu와 아랫면인 B.Cu가 있다. 흰 선은 부품의 외곽선에 해당하는 실크스크린 레이어(F.SilkS)로서 PCB 위에 인쇄된다. 가장 바깥쪽의 보라색 선은 부품 배치 공간을 규정하는 레이어인 F.CrtYd(courtyard)이다. 여기에서는 정확한 부품 외형에 해당하는 패브리케이션 레이어(F.Fab)가 생략되었다.

다음의 사례는 기본 라이브러리에서 고른 직경 3mm LED의 풋프린트이다. 회색으로 표현된 F.Fab이 보인다.



위에서 소개한 DIN5_MIDI.kicad_mod를 그대로 사용할 수는 없다. 부품마다 외형 치수가 조금씩 다르기 때문이다. 따라서 AliExpress에서 실물 부품을 먼저 주문하였다. 이를 버니어 캘리퍼스로 정밀하게 측정한 뒤 DIN5_MIDI.kicad_mod를 수정하면 된다. KiCad 튜토리얼에서 Custom Symbol과 Footprint를 생성하고 수정하는 법을 소개하고 있다. 그것도 번거로우면 부품 도면을 ChatGPT에 밀어 넣은 뒤 파일을 만들어달라고 해 보면 된다.


반신반의하면서 SparkFun Electronics에서 제공하는 데이터시트(PDF)를 업로드해 보았다. 파일에서 필요한 부분만 잘라내어 다각도로 판단하며 해석하는 것도 인공지능의 몫이다. 도면의 레이아웃을 이해하는 데 한참의 시간을 소비하였다. 약 5분 20초 후 생성된 결과물을 확인해 보자.


이 풋프린트는 업로드하신 4UCON 도면의 Recommended P.C.B. Layout (Top View)를 기준으로, 7개 홀 위치를 반영하여 만들었습니다. 핀 좌표는 도면에 제시된 2.8 mm, 12.5 mm, 15 mm, 세로 10 mm / 14.6 mm 치수를 사용했고, 드릴은 7ר1.5 mm로 설정했습니다.

참고로 넣어 둔 항목은 다음과 같습니다.

  • 패드 번호: 1~5, 접지 셸은 E
  • 레이어: F.SilkS, F.Fab, F.CrtYd
  • 외곽선은 도면의 본체 치수를 바탕으로 한 단순화된 외형

주의할 점은 다음과 같습니다.

  • 이 파일은 홀 위치 중심의 실사용 풋프린트로는 바로 써볼 수 있지만,
  • 실크 및 외곽 형상은 도면 해상도 한계로 인해 일부를 단순화했습니다.
  • 실제 구매한 부품과 100% 맞추려면, 부품 실측 후 실크와 courtyard를 한 번 더 다듬는 것이 안전합니다.

원하시면 다음 단계로 바로 이어서 “패널 전면 기준으로 보드 엣지 정렬까지 고려한 버전” 또는 “DIN-5_MIDI_THT_horizontal.kicad_mod” 같은 원하는 파일명 버전
으로 다시 정리해 드릴게요.

ChatGPT가 부품 데이터시트를 이용하여 생성한 KiCad 풋프린트 파일.

정말 놀랍다. 이를 바탕으로 실측을 한 뒤에 '핀 2와 3의 간격을 1mm 더 벌려 줘'라고 지시해도 될 것이다. 

회로도는 마무리하였지만 실제 보드 아웃라인을 만들고 부품을 배치하여 라우팅을 한 뒤 DRC(Design Rule Check)까지 거쳐서 PCB 설계를 완성하려면 더 많은 공을 들여야 한다. 오늘 주문한 커넥터가 어서 배송되어 측정을 거쳐 정확한 수치를 얻은 뒤 PCB 설계를 마치게 되기를 기대해 본다.  

PubMed에서 시작되는 힘 — 데이터 리포지터리의 진짜 교훈

생명과학 데이터 인프라를 이야기할 때 많은 사람은 먼저 데이터의 규모를 떠올린다. 몇 PB의 데이터를 저장하고 있는가, 몇 개의 데이터셋이 등록되어 있는가 같은 지표가 흔히 등장한다. 그러나 세계에서 가장 영향력 있는 생명과학 정보 인프라를 운영하는 NCBI (National Center for Biotechnology Information)의 사례를 보면, 데이터의 양만으로는 그 성공을 설명하기 어렵다.

NCBI의 진짜 힘은 데이터의 규모가 아니라 지식 접근 구조에 있다. 그리고 그 구조의 출발점은 바로 PubMed이다.



생명과학 연구자는 거의 예외 없이 PubMed에서 탐색을 시작한다. 새로운 연구 주제를 찾을 때도, 특정 유전자나 질병에 대한 정보를 확인할 때도, 가장 먼저 찾는 것은 논문이다. PubMed에서 논문을 검색하고, 논문을 읽다가 관련 유전자나 데이터셋을 확인하면 자연스럽게 NCBI의 데이터베이스로 이동하게 된다.

이 과정은 매우 자연스럽게 이루어진다. 논문 페이지에는 관련 데이터로 연결되는 링크가 이미 준비되어 있기 때문이다. 그 결과 연구자는 다음과 같은 흐름을 경험하게 된다.

논문 → 데이터 → 분석

이 단순한 흐름이 바로 NCBI 시스템의 핵심이다. 논문을 읽다가 클릭 몇 번으로 서열 데이터나 발현 데이터로 이동할 수 있고, 다시 분석 도구로 이어질 수 있다. NCBI는 데이터를 단순히 저장하는 것이 아니라 논문과 데이터를 연결하는 지식 네트워크를 설계하였다.

많은 데이터 리포지터리가 간과하는 부분이 바로 이 지점이다. 데이터 플랫폼을 구축할 때 흔히 강조되는 것은 데이터의 수와 저장 용량이다. 그러나 연구자의 실제 행동을 생각해 보면, 연구자는 데이터베이스에서 출발하지 않는다. 연구자는 항상 논문에서 출발한다.

따라서 데이터 리포지터리가 연구 생태계에서 의미를 가지려면 데이터 자체보다 데이터에 도달하는 경로가 중요하다.

K-BDS에 주는 정책적 시사점

이 문제는 국내 바이오 데이터 정책에서도 생각해 볼 만하다. Korea BioData Station (K-BDS) 같은 데이터 플랫폼의 성과는 종종 다음과 같은 지표로 평가된다.

  • 등록된 데이터셋 수
  • 저장 용량
  • 데이터 업로드 건수
  • K-BDS에 데이터를 등록하여 그 accession number를 인용했거나, 또는 K-BDS에 이미 등록된 데이터를 재활용하여 출판한 논문의 수(data announcement 논문도 포함할 수 있으나 임팩트는 다소 낮게 평가된다)

하지만 이러한 지표만으로는 데이터 인프라의 실제 가치를 충분히 설명하기 어렵다.

데이터가 연구 생태계에서 실제로 사용되기 위해서는 다음과 같은 조건이 필요하다.

  • 연구자가 데이터를 쉽게 발견할 수 있어야 한다
  • 데이터가 연구 논문과 연결되어 있어야 한다
  • 데이터가 분석 도구와 연결되어 있어야 한다

즉 데이터 플랫폼의 핵심은 저장 공간이 아니라 지식 접근 구조이다.

NCBI가 보여주는 교훈은 명확하다. 데이터 인프라는 단순한 데이터 저장소가 아니라 연구자가 지식에 접근하는 경로를 설계하는 시스템이다. PubMed는 그 입구 역할을 하며, 다양한 데이터베이스는 그 내부 구조를 구성한다.

결국 NCBI의 성공은 데이터의 양이 아니라 논문을 중심으로 한 지식 인덱스 구조에서 비롯된다.

데이터 정책을 논할 때 종종 잊히는 사실이 하나 있다.

데이터는 모은다고 해서 자동으로 활용되지 않는다.

데이터가 작동하려면 연구자가 그것을 발견할 수 있어야 하고, 논문과 연결되어 있어야 하며, 분석으로 이어질 수 있어야 한다.

NCBI는 그 구조를 만들어 냈다.

그리고 그 모든 것은 PubMed에서 시작된다.

AI 시대가 도래함으로써 연구자가 직접 논문을 찾고 데이터를 (재)분석하는 수고를 덜게 되었고, 모든 리포지토리는 보유 데이터를 얼마나 많이 AI-ready 형태로 가공하여 제공하고 있는가로 평가를 받게 될 것 같다. 특히 정부의 지원으로 운영되는 데이터 인프라의 경우 그러한 압박감은 더욱 심하다. 도대체 언제부터 데이터 인프라의 가장 중요한 목적이 AI에게 먹이를 제공하는 것이 되었는가?

그러나 이 질문에는 신중하게 답변해야 한다. 데이터 리포지터리의 역할은 AI 학습용 데이터 공급자로 축소되어서는 안 되기 때문이다. AI 모델은 데이터를 소비하지만, 데이터의 의미와 맥락은 여전히 연구 공동체 속에서 형성된다. 논문, 실험 설계, 데이터 생성 과정, 데이터 해석의 논리 등은 데이터 파일만으로 대체되기 어렵다.

다시 말해서 AI 시대에도 여전히 중요한 것은 지식 생태계의 구조이다. 'AI 학습에 필요한 데이터와 컴퓨팅 자원을 확보하는 것이 무엇보다도 가장 시급해'  'AI가 이제 연구도 알아서 해 주니까 나는 연구 소비자처럼 이를 이용만 하겠어' 이런 주장과 논리 속에서 중요한 것을 잃어서는 안 된다.

데이터는 AI가 읽을 수 있어야 하지만, 지식은 여전히 연구 공동체 안에서 만들어지기 때문이다.


이 글은 정해영의 아이디어를 바탕으로 AI(ChatGPT)의 도움을 받아 작성되었습니다. 본 텍스트는 Creative Commons Attribution 4.0 International(CC BY 4.0)라이선스로 공개됩니다. 출처를 표시하는 조건으로 누구나 자유롭게 이용·수정·재배포할 수 있습니다. 정확성에 대한 보증이나 법적 책임은 제공되지 않습니다.