2024년 7월 31일 수요일

유선 다이나믹 마이크로폰의 비교(CAMAC SM-221 vs. Dynatec Omega) - 실은 커넥터와 케이블을 제대로 맞춰서 쓰는 것이 더 중요하다

오늘의 실험은 두 마이크로폰의 감도를 비교하는 것이 목적이다. 비교 대상은 원래 갖고 있던 CAMAC 제품과 최근에 구입한 다이나텍 오메가. 감도를 측정하는 전문 장비가 있는 것은 아니다. 동일 조건에서 녹음을 하여 신호의 진폭을 대충 눈으로 비교하여 판단하고자 하였다.

Dynatec Omega(위)와 CAMAC SM-221.

Behringer U-Phoria UM2 오디오 인터페이스의 MIC/LINE 단자에 XLR-XLR 케이블을 이용하여 두 종류의 마이크로폰을 번갈아 연결하였다. 게인 조절 노브는 3시에 두었고, 휴대폰에서 유튜브의 핑크 노이즈를 재생하면서 Audacity에서 녹음을 하여 서로 비교해 보았다.

위: CAMAC, 아래: Dynatec. 감도는 CAMAC의 것이 훨씬 높음을 알 수 있다.

CAMAC 마이크로폰의 감도가 현저히 낮다고 생각하여 새 것을 구입하게 되었는데, 제대로 된 케이블을 사용하여 비교를 해 보니 예상과 판이하게 달랐다. CAMAC 제품의 감도가 특별히 나쁜 것이 아니었다.

마이크로폰의 여러 성능 지표 중에서 감도가 가장 중요한 것은 아니다. 

흠... 세상에 아주 몹쓸 음향 장비는 없는 것 같다. 아, 알리익스프레스에서 호기심으로 구입한 무선 마이크로폰은 빼고. 제대로 된 케이블을 사용하여 제 위치의 커넥터에 꽂는 것이 장비의 선택보다 더욱 중요한 것 같다. 

수업료를 치르면서 자꾸 장비의 수만 늘어 간다. 잡스런 지식도 이에 따라서 늘어나지만, 얼마나 영양가 있는 지식을 쌓아 나가고 있는지 확신하기는 어렵다. 

이번에는 XLR-TRS 케이블로 CAMAC 마이크로폰을 연결한 뒤 같은 조건에서 녹음 테스트를 해 보았다. 맨 아래의 것이 새로 녹음한 것이고, 위의 두 개는 앞서 보인 스크린샷과 같다. 즉, XLR-XLR 케이블을 사용한 것이다.


결론은 명확하다. 제대로 된 케이블을 제 커넥터에 꽂아라. 오늘의 포스팅은 마이크로폰 비교 테스트가 아니었다.


섣부른 결론은 금물 - 장비에 따라 다르다

ALTO Uber PA 앰프의 콤보잭은 어떨까? XLR 커넥터와 중앙의 TRS 커넥터에 같은 수준의 신호를 보내면, 출력에 차이가 있을까? 매뉴얼에는 이에 대해서 별다른 언급을 하지 않았다. 채널 1에는 XLR 케이블을, 채널 2에는 TRS 케이블을 꽂아 놓은 뒤 CAMAC 마이크를 번갈아 끼워 가면서 스피커로 나오는 소리의 크기를 비교해 보았다. 녹음용 프로그램을 쓰기는 곤란하니 - 라인 아웃에 선을 꽂아서 오디오 인터페이스로 보내도 되지만 - 귀로 평가해 보았다. 이번에는 스피커로 나오는 소리의 크기에 차이가 느껴지지 않는다.



따라서 1/4" TRS 커넥터에 PAD가 개입하지 않은 것으로 보인다. ALTO Uber PA 앰프를 사용한 테스트를 통해서 오늘의 결론을 살짝 바꾸기로 하였다. 

"커넥터와 케이블의 특성을 명확히 이해한 뒤에 연결하도록 해라."


2024년 7월 30일 화요일

다이나텍 오메가(Dynatec Omega) 마이크로폰 구입

전용 가방에 홀더까지 갖춘 국산 다이나믹 마이크로폰이 하나에 1만원도 되지 않는 가격에 팔린다면? '국민 마이크'로 여겨지는 Shure SM58을 선뜻 구입하기 어려운 방구석 음악인에게는 정말 은총과 같은 제품이 아닐 수 없다. 제조사인 KD Sound는 어떤 사연으로 이렇게 싼 가격에 처분을 해야 하는지는 알 수 없으나 재고가 전부 소진되기 전에 얼른 구입하는 것이 현명할 것이다. 별 주저함 없이 주문을 하였고, 짧은 여름 휴가를 마치고 돌아오니 문 앞에는 작은 상자가 하나 놓여 있었다.

하나가 아니고 두 개! 조금 비싼 점심 먹었다고 생각하면 될 것이다. 본체의 무게는 310그람이나 되어 상당히 묵직하다. 내가 소유한 카날스 BKD-101(280그람)보다 무겁다.

이 마이크로폰에는 두 개의 스위치가 달려 있다. 오른쪽 것은 일반적인 ON/OFF 스위치이고, 왼쪽('HP')은 주파수 특성을 바꾸는 스위치이다. 아래로 내린 상태에서는 저음이 두툼하게 들려서 노래를 부를 때 어울리고, 위로 올리면 저음이 저감되어 스피치에 어울린다고 한다.


주파수 특성 그래프에서 왼쪽 스위치(HP)를 위로 올렸을 때에는 점선과 같은 모양, 즉 저음이 줄어든 효과를 나타낸다. 감도는 -72 dB ± 3 dB이다. 내가 갖고 있는 또 다른 마이크로폰인 카날스 KBD-101은 -55 dB. 슈어 SM58은 -54.5 dB이다. 따라서 이 마이크로폰의 감도는 낮은 편이다.

마이크로폰을 쥔 엄지손가락에 의해 스위치 설정 상태를 건드리지 않도록 일부러 이런 부품을 쓴 것 같다. Behringer U-Phoria UM2 오디오 인터페이스에 연결한 뒤 Audacity로 녹음 테스트를 실시해 보았다. 마침 집에 있는 케이블은 XLR-TS(unbalanced)뿐이라서 좋은 음질로 녹음하기는 틀렸다. 

내가 별로 좋아하지 않는 XLR-TS(1/4인치 = 6.35mm) 케이블.

잡음을 줄이기 위해서 게인 노브는 3시 방향에 두었다. 음량이 다소 낮게 녹음이 되어서 Audacity에서 음량을 6 dB 올렸다. 소리 특성이 현격하게 바뀜을 알 수 있다.


부록 1 - XLR(balanced) 커넥터를 TS(unbalanced) 커넥터로 연결하는 방법

구글을 검색해 보면 연결 방법을 쉽게 찾을 수 있다. 나는 직접 커넥터를 열어서 확인해 보기로 했다. 마이크로폰에 연결되는 XLR female 커넥터를 직접 눈으로 살펴보자. 구멍 옆에 숫자가 새겨져 있다.  밸런스 접속을 하려면 1번은 그라운드, 2번은 핫(즉 포지티브), 3번은 콜드(즉 네거티브)로 연결한다. 


커넥터 안쪽에서는 2번과 3번 핀을 케이블의 그라운드에 한꺼번에 납땜해 놓았다. 겉에서 보이는 핀은 3개이지만 커넥터 안쪽에는 4개의 단자가 있었다. 숫자가 새겨져 있지 않는 또 하나의 단자는 커넥터의 전도성 본체와 연결된 상태였으며, 2번과 3번핀은 여기에도 납땜이 되어 있었다.


접속 상태를 설명하는 짧은 나래이션을 넣어 녹음했다가 마음에 영 들지 않아서 오디오는 전부 지웠다. 특별히 프롬프터 같은 것을 쓰고 있지도 않으면서도 자연스럽게 대사를 처리하는 유튜버나 방송인들의 능력이 부럽다.


부록 2 - 같은 채널을 차지하고 있다 하더라도 XLR 단자와 1/4인치 TRS 단자는 동등하지 않을 수 있다(2024년 7월 31일 업데이트)

열흘 전에 쓴 글(올바른 케이블(커넥터)의 선택 - 합주 연습을 하는데 왜 베이스의 소리가 작을까?)에서 보였듯이 동일 채널 스트립에 존재하는 XLR 단자와 TRS 단자는 장비에 따라서 동등하지 않을 수 있다. 따라서 되도록이면 XLR-XLR 케이블을 쓰는 것이 신호의 손실을 줄일 수 있다. 1/4인치 TRS 단자는 기기 내부에 PAD(pre-attenuation device)가 들어 있는 경우가 많기 때문이다.

그렇다면 믹서나 PA용 액티브 스피커 또는 오디오 인터페이스 등에서 종종 보이는 XLR/TRS 단자는 어떨까?


Quick Start Guide에 실린 'Specifications'를 보면 max. input level은 Mic: +2 dBu/Line: +22 dBu / Instrument: +2 dBu라고 하였다. 즉 위에 보인 XLR/TRS 콤보 잭(잭'jack'은 암 수 커넥터 모두에 쓰일 수 있는 표현이지만 주로 고정되어 있거나 패널에 장착되는 쪽을 말한다)은 어떤 종류의 케이블을 꽂느냐에 따라서 수용할 수 있는 신호의 범위가 크게 다른 것이다. 무려 10 dBu의 차이가 난다. 이렇게 하려면 line input, 즉 중앙의 TRS 커넥터에 attenuator를 넣지 않을 수 없다.

그러면 나는 뭐하러 XLR-TRS 케이블을 샀단 말인가... 정말 쓸 곳이라고는 없는 물건이었다. TRS 플러그 쪽을 뚝 잘라서 XLR male 커넥터를 연결해 버리고 싶다.

이번의 '가장 적합한 케이블을 고르는 수업'은 너무 길었다. 오른쪽 케이블(XLR to 1/4" TRS)는 마이크로폰을 연결하기에 적절하지 않다.


2024년 7월 25일 목요일

점심 공연을 무사히 마치다

우연한 기회에 시작한 밴드의 2024년 두 번째 공연(7월 23일)을 성황리(?)에 마쳤다. 지하실에서 30~40명이 빼곡하게 모여서 관람을 했으니 마치 많은 사람이 온 것 같은 착시 효과가 있는지도 모른다. 준비했던 샌드위치가 소진된 분량을 감안하면 최소한 60명 정도는 공연장에 들렀다 간 것으로 보인다. 준비한 곡은 다음과 같이 총 아홉 곡이었다.

  • 싹쓰리 - 다시 여기 바닷가(플레이댓케이팝 - 유튜브)
  • 김동률 - 다시 사랑한다 말할까
  • 윤도현 밴드 - 나는 나비
  • 정해영(자작곡) - 호수섬 이니스프리*(반주 트랙, 버전 3 참조)
  • 더 자두 - 대화가 필요해*
  • 듀스 - 여름 안에서(플레이댓케이팝 - 유튜브)
  • 하림 - 출국*
  • Guns N' Roses - Sweet child o' mine(D Major로 조옮김)
  • 윤종신 - 팥빙수*

  • 드럼과 건반은 반주 트랙으로 대신하였으며 별표(*)를 한 곡은 노래방 모드, 즉 보컬을 뺀 반주 트랙을 틀어 놓고 노래를 불렀다. 

    공연이 끝나고 휑한 빈자리. 파티는 끝났다.

    공연 전 일요일 오후의 마지막 연습. 나는 맨 오른편에서 빨간 베이스를 연주하고 있다.


    나는 감도가 별로 좋지 않은 초저가 마이크로폰(Camac SM-221)을 사용했는데, 사전에 레벨을 충분히 확인하지 못한 상태로 노래를 불렀더니 가사 전달이 잘 안 되었다고 한다. 역시 관객의 위치에서 모든 파트의 음량이 적당한지 체크하는 과정이 꼭 필요하다. 

    하이라이트에 해당하는 Guns N' Roses의 Sweet Child O' Mine 연주 동영상(1280x720 mp4, 5분 42초, 85.3MB)를 여기에 올려 보겠다. 구글 블로그에 올리는 동영상은 15분 미만이면 업로드 제한도 없고 블로그 용량을 소모하지도 않는다고 하는데, 정말 그러한지 확인을 해 보자.


    이번 공연을 통하여 소규모 공연 장비를 다루는 방법을 많이 알게 되었다. 물론 내가 부른 노래에서 가사 전달에 실패했으니 완벽하지는 못하였다. 베이스 연주에 대해서도 많은 자신감을 얻었다. 

    과연 세 번째 공연도 하게 될 것인가? 음악에 대한 최근의 열정은 업무 스트레스와 비례하는 것 같다. 모든 것이 풍족하고 만족스럽다면 음악에 몰두하지 않을 것이다. 평소 생활이 약간 괴롭더라도 음악으로 풀 방법이 있으니, 그런대로 잘 견뎌 나갈 것 같다.

    2024년 7월 24일 수요일

    커피 안 마시기

    나는 커피를 참 좋아하는 편이다. 백 원짜리 동전을 넣어서 종이컵에 딱 반 정도 받아 먹던 자동판매기 커피를 학창 시절에는 얼마나 많이 마셨던가?

    집에서 커피 원두를 직접 갈아서 뜨거운 물을 부어 우려서 먹은 적도 있었고, 아들이 선물한 가정용 에스프레소 머신을 사용해 본 일도 있었다. 원두의 원산지나 로스팅, 또는 블렌딩 정도에 따라서 달라지는 향미를 느끼면서 커피를 즐기는 수준은 전혀 아니다. 느리고 번거롭게 커피를 만들어 마시는 방법을 몇 년 동안 해 보다가 결국은 커피믹스 - 카누 - 캔커피의 편리함에 빠져들기도 했었다. 최근 몇 년 동안은 편하게 마실 수 있는 커피를 선호했었다. 집에는 커피를 분쇄하고 내리기 위한 온갖 용품과 쓰다 남은 드립용 여과지가 잔뜩 남아 있다.

    올해 들어서 또 다시 나의 위장이 편하지 않다는 신호를 보내기 시작하여 일단 커피를 끊었다. 그 후로 약 열흘 정도가 지난 것 같다. 과거에도 속이 좋지 않아 커피를 1년이 넘게 마시지 않은 적이 있었다. 속이 불편하게 느껴지는 것은 커피 때문인지, 업무에 따른 스트레스 때문인지는 잘 모르겠다.

    카페인의 중독성이 생각보다 높지 않다는 것은 확실하다. 출근 직후 견디지 못할 정도로 커피가 생각나는 것은 아니니까. 이른 출장을 떠나기 위해 아침 일찍 대전역에 나온 직후 약간의 피로감과 졸음을 느끼면서도 커피를 통해 이를 떨쳐 버리겠다는 생각도 요즘은 잘 들지 않는다. 커피를 끊은 이후 밤에 잠을 잘 이루는 것도 좋은 일 아니겠는가. 

    외근 중에 잠시 일을 하기 위하여 카페에 들를 때에는 밀크티를 마시는 편이다. 밀크티의 주성분인 홍차에도 카페인이 함유되어 있지만, 양도 비교적 적고 커피만큼 흡수가 빠르지는 않은 것으로 알고 있다. 

    가장 문제가 되는 것은 회의장에서 무차별로 제공하는 커피. 간혹 취향을 존중하여 다른 종류의 음료수를 같이 놓아 두기도 하는데, 지나치게 달아서 먹기가 괴롭다.

    이런 생활을 하다가 오후에 커피 한 잔을 마시면, 그날 밤은 잠을 이루지 못한다. 커피를 끊은 동안 카페인에 대한 감수성이 극도로 높아진 때문이리라.

    연말까지 버텨 보는 것을 목표로 해 보겠다.


    2024년 8월 25일 업데이트

    커피를 완전히 끊은 것은 아니다. 단, 아침 식사를 한 뒤 사무실에 나와서 한 잔을 마시는 것으로 그날의 커피 음용은 끝이다. 위장은 확실하게 편해졌다. 그러나 밤에 한 번도 깨지 않고 아침까지 자는 것은 여전히 잘 되지 않는다. 아마도 최근 3주 동안 '밤 달리기'를 시도하면서 각성 상태가 유지되어 그런지도 모르겠다.

    2024년 7월 21일 일요일

    올바른 케이블(커넥터)의 선택 - 합주 연습을 하는데 왜 베이스의 소리가 작을까?

    믹서 + 파워앰프의 조합을 파워드믹서(Samson XML610)으로 바꾼 뒤 일렉트릭 베이스의 소리가 다른 악기의 소리에 묻힌다는 느낌이 들었다. 30 dB의 이득을 제공하는 액티브 DI box를 써서 파워드믹서에 연결을 하고, 믹서 채널의 레벨을 최대로 올려도 다른 악기에 비해서 음량이 조금 부족하다. 왜 그런지 그 원인을 알아보기로 하였다.

    별도의 믹서(Behringer Xenyx 802)를 쓸 때에는 DI box의 출력을 마이크로폰 전용의 1~2번 채널에 연결한 뒤, 추가적인 게인을 올리는 노브(아래 그림의 주황색 네모)를 돌려서 베이스의 음량을 높여서 사용하였었다. 처음에는 DI xbox와 믹서를 연결하기 위해 XLR-XLR 케이블을 사용하다가 나중에 XLR-TRS(1/4 인치)을 구입하여 교체하였다. 그렇게 되었던 이유는 1/2번 채널을 두 대의 마이크에 내어 주어야 했기 때문이다. 그 후로는 노브를 돌려서 추가 게인을 얻기는 어려웠지만, 음량이 그렇게 부족하다고는 생각하지 않았다. 스테레오 전용의 채널 중 L 채널에만 베이스를 연결할 경우 모노로 인식이 되고, balanced 케이블 접속은 여전히 가능하다.


    Samson 파워드믹서의 마이크로폰 전용 채널(1~4번)에는 별도로 게인을 올리는 노브가 없다.. 그리고 매뉴얼에 나오는 사양을 비교해 보아도 프리부의 최종적인 게인은 Behringer의 것보다 다소 낮다. 

    채널의 레벨을 최대로 올려도 음량이 부족하다면, 3-band EQ의 중저음부를 올려서 일렉트릭 베이스의 음량을 최대 15 dB까지 끌어 올릴 수 있을 것 같다. EQ를 이런 목적으로 쓰는 사람은 없겠지만. 만약 Main mix에 적용되는 7-band EQ를 매만지면 추가적으로 게인을 확보할 수 있을 것도 같다.

    두 장비의 블록 다이어그램을 비교하면서 혹시 다른 차이가 없는지 알아보았다.

    XML610의 5/6, 7/8, 9/10, 11/12 스테레오 채널에는 balanced cable을 꽂을 수는 있지만, ring(cold)를 그라운드에 직결해 놓았다. 내 기억이 맞다면, 6 dB만큼 신호가 줄어든다. 그것은 Xenyx 802도 마찬가지이다. Balanced cable을 꽂을 수 있을 뿐, balanced connectione다운 작동을 보장하는 것은 아니다. 9/10 및 11/12 스테레오 채널은 MUTE 버튼을 눌러도 신호가 계속 전달된다. 다른 스테레오 채널과 별로도 그림을 그린 것은 이 때문이다.

    XLR 단자와 병렬로 연결된 1/4 인치 커넥터는 라인 레벨의 출력이 아니라면 쓰지 않는 것이 좋을 것이라는 생각이 들었다. 위의 그림에도 적나라하게 보였듯이, XML610이나 Xenyx 802 전부 1/4 인치 커넥터에는 PAD(pre-attenuation device, 빨간 별 표시)가 연결되어 있다. XML610에서 버튼으로 작동되는 PAD와는 따로 작동한다. 라이브에서 PAD를 쓰는 이유는 야마하 미국 웹사이트의 Using PAD in live sound를 참고하기 바란다.

    오늘 오후에는 우리 밴드의 공연 전 마지막 연습이 있을 예정이다. 일렉트릭 베이스 -> active DI box -> XML610의 1~4번 입력 채널 중 XLR 단자를 이용하되, 3-band EQ의 중저음을 조금 올려서 원하는 수준으로 올리는 실험을 해 봐야 되겠다. Xenyx 802는 3개 밴드에 대하여 +/- 15 dB 조절이 가능하지만, XML610은 미드레인지에 대해서는 +/- 12 dB로 제한되어 있다. 7-band graphic EQ에서도 +/- 12 dB 범위에서 조절 가능하다. Xenyx는 각 채널의 레벨 조절 노브 눈금에 -∞..15 dB의 범위가 인쇄되어 있으나 XML610은 0..10으로만 표시하였다.

    오디오 믹서의 사양표에 나오는 게인은 이퀄라이저를 통해 추가로 얻을 수 있는 게인은 제외하고 표시하는 정상일까? 나도 말 모르겠다.

    공연 현장에서 믹서를 2개 이상 사용하는 일도 흔히 있다고 한다. Xenyx 802에 지금까지의 방법으로 내 베이스를 연결하고, 메인 믹스 출력을 XML610에 연결할 수도 있다. 그러나 장비 구성을 단순화하기 위하여 파워드믹서를 구입한 것이 아니었던가? 꼭 필요한 상황이 아니라면 이렇게까지 해서 장비 구성을 복잡하게 하지 않는 것이 바람직할 것이다. 

    두 개 이상의 믹서를 연결하는 법은 다음의 자료를 참고하자.

    https://kettnercreative.com/audio-mixer/connect-audio-mixers-together/ (동영상 링크)


    2024년 7월 22일 업데이트

    Active DI box와 파워드믹서 사이를 XLR-XLR 케이블로 연결하고 3-band EQ를 살짝 올려서 충분한 수준의 베이스 음량을 얻을 수 있었다. 엇, 그런데 -30 dB attenuator 토글 스위치가 혹시 그동안 작동 중이었었나? 갑자기 자신이 없어졌다.

    2024년 7월 18일 목요일

    K-BDS에 데이터를 등록하는 작업 자체가 새로운 차원의 창작이 될 수도 있다 - 데이터의 복원

    게놈 고물상 영업 차원에서 과거 연구 기록물을 뒤져서 재활용이 가능한 것은 국가바이오데이터스테이션(K-BDS)에 등록하느라 짬짬이 등록하느라 애를 먹고 있다. 연구과제 보고서, 논문, 그리고 논문에 부속된 염기서열 등 정보를 GenBank 등 공개된 데이터베이스에 등록한 것. 이 세 가지는 연구 과정을 돌아볼 수 있는 무수한 자료 중에서 극히 일부에 지나지 않는다. K-BDS는 NGS 등 raw data의 등록을 적극 권장하고 있다. 나는 이보다 더 나아가서 연구 노트와 컴퓨터에 남아 있는 중간 형태의 자료를 정리하여 K-BDS에 등록하기 위해 꽤 많은 노력을 들이고 있다.

    그 '정리' 작업이라는 것이 상당히 고통스럽다. 그 자체가 리서치 수준에 버금가는 노고와 지적 활동을 요구하기 때문이다. 연구 노트를 뒤적이면서 큰 줄거리만 다시 파악하여 ReadMe 파일을 만들려고 하지만, '이때 왜 이런 PCR을 했었지?'와 같은 세부적인 사항도 가끔씩은 꿰뚫어 봐야 하기 때문이다. 대장균 BL21(DE3)의 유전체 해독처럼 온갖 기법의 시퀀싱 기법을 동원하여 완수했던 프로젝트는 더욱 그렇다. 데이터가 점진적으로 성장하고 발전하는 것이 아니라 마치 애벌레에서 번데기를 거쳐서 나비 성체가 나오듯이 급격한 변화를 겪는 순간들이 있는데, 연구 노트를 다시 펼쳐서 밑줄을 그어 가면서 읽어도 당시의 상황이 쉽게 재구성이 되지 않는다. 2005~2006년의 노트와 컴퓨터에 남은 파일을 대조해 가면서 거의 새로운 수준의 연구를 하는 셈이다.

    심지어는 파일 자체를 고쳐야 할 때도 있다. 예를 들어서 어느 ace 파일을 consed에서 열었더니 이런 메시지가 나온다. 

    exception thrown: could not open PHD file ../phd_dir/ED229-230_229.1.ab1.phd.2
    ...
    exception thrown: PHD file timestamp mismatch:  ace file says Wed Mar 8 10:40:30 
    2006 but PHD file says Fri Nov 24 10:25:49 2006 for read ED100-101_100.1.ab1
    Did you use the phredPhrap perl script?  You should.  Click on help in the 
    aligned reads window for documentation
    

    두 가지의 예외 상황에 맞닥뜨렸다. 앞의 것은 phd.2 파일(총 42개)이 없다는 것이다. Phd.1은 phred를 처음 실행했을 때 만들어지는 것이고(consed에서 Add New Reads를 실행했을 때도 포함), phd.2부터는 consed에서 크로마토그램의 피크를 직접 보면서 편집을 한 것이 기록된다. ace 파일을 보관하기 위해서 복사하는 과정에서 이런 실수가 남은 것이다. 뒤의 것은 52개의 크로마토그램에 대해서 phd 파일과 ace 파일에 기록된 timestamp가 맞지 않다는 뜻이다. 어떤 이유로 원본 phd 파일이 삭제되고, 이를 나중에 phred로 다시 만들다 보니 이미 존재했던 ace 파일과 불일치가 생겼음을 의미한다. Phd 파일과 ace 파일 둘 중의 하나를 고쳐야 한다. K-BDS에 등록하기 위해 데이터 파일에 '침습적'인 가공을 거쳐야 하다니! 여간 성가신 일이 아니다.

    예외 상황 1은 복구 불가, 그러나 예외 상황 2는 약간의 스크립트를 써서 복구 가능... 자, 이를 어찌할 것인가? 예외 상황 1은 완전히 복구가 불가능한 것은 아니다. 원본 크로마토그램은 고스란히 남아 있으니, 누구든지 이를 Add New Read로 넣어 보면 된다. 2번 상황만 고쳐 놓은 뒤, 1번에 이르는 과정은 직접 실습해 볼 수 있게 설명을 잘 달아 놓으면 될 것이다. 

    박물관의 유물 복원실에서 늘 하는 일을 상상해 보자. 아무리 철저히 고증을 거친다 해도, 복원은 일종의 창작을 수반하지 않을 수 없다. '손상된 데이터의 복원'에도 이처럼 많은 조사와 궁리, 그리고 구체적인 복원에 따르는 창작 수준의 노력이 들어가야 함을 느꼈다. 그리고 내가 시도하는 복원 그 자체는 데이터의 본질을 훼손하는 것이 아니라고 믿는다. 

    그러면 2번 예외 사항에 대한 수정을 해 볼까? 파일로 리다이렉션한 화면 출력을 살펴보니...

    more errors, but will not report them

    아이고, 어쩌면 52개만 수정하는 것으로 끝날 일이 아닌것 같다. 이 ace 파일 전체에 수록된 430개의 read에 대한 phd file timestamp를 ../phd_dir에 현재 남아 있는 phd 파일의 그것으로 바꿔야 하겠다. 생각보다 일이 점점 많아진다.

    모니터 앞에서 점심 도시락 먹으면서 bash BASH/Perl 스크립트로 간단히 해결하였다. 얼마 만에 돌려 보는 regular expression인가! 

    2024년 7월 16일 화요일

    눈알의 해부학

    아이디어 회의를 겸한 점심 모임에서 ETRI 들과 이야기를 하다가...

    이렇게 도입부를 써 놓고 보니 마음에 들지 않는다. 이른바 존대어 범람시대(참고할 글: 접미사 '-분', '-님', 고객분, 고객님, '손님'인가, '손님분'인가)가 되어 어색한 표현이 너무 많아진 것에 대하여 나도 매우 비판적이다. 

    아이디어 회의를 겸한 점심 모임에서 ETRI 사람들과 이야기를 하다가...

    이렇게 쓰면 예의에 어긋나는 것일까? 만약 그 대상에 기관장 등 주요 경영진이 포함되어 있다면? 아, 나도 모르겠다. 어쨌든 그런 모임에서 떠오른 여러 화제 중 인조 눈(眼)을 구현하는 방법도 포함되어 있었다. 주로 망막에 맺히는 상을 어떻게 전기 신호로 전환할까에 대한 것이 관심사였는데, 나는 이에 대한 보다 실제적인 문제를 제기하였다. 망막을 전자 회로로 대체하고 이를 전기 케이블로 연결하는 것이 가능하다 해도, 마치 헤어 드라이어의 전원 케이블이나 휴대폰 충전기 케이블이 반복적인 움직임으로 연결 부위가 쉽게 망가지듯이 계속되는 안구의 움직임에도 잘 견디는 특수한 전도성 케이블을 만드는 것이 더 어려울 지도 모른다는 의견을 냈다.

    그랬더니 '망막은 고정되어 있는 것 아닌가요? 아니, 생물학자 아니셨던가요?'하는 반문을 들었다. 어? 정말 그런가? 순간적으로 나는 반론을 제기하기 힘들었는데, 모임을 마치고 와서 생각해 보니 절대 그럴 리가 없었다. 카메라를 생각해 보자. 카메라가 움직이면 필름도 따라 움직인다. 빛의 다발이 카메라를 통과해서 카메라 뒤편의 고정된 필름에 상이 맺히는 것은 아니지 않은가? 눈알도 이와 같은 방식이 아니었던가? 단지 좁은 공간 안에서 쉽게 회전할 수 있도록 구형으로 생겼을 뿐.

    갑자기 눈알의 해부학이 궁금해졌다. 눈알은 얼마나 큰가? 시신경과 근육은 어떻게 눈알에 붙어 있나? 안구는 멋지고 예의 바른 낱말이고, 눈알은 그렇지 않은 낱말이라고 생각하지는 않는다. 

    사람 안구의 평균 지름은 24 mm로, 골프공(42.67 mm)이나 탁구공(40 mm)보다 훨씬 작다.

    바로 위의 글은 한겨레신문에 실린 해부학 실습 참관기 '조심스레 적출한 안구는 탁구공보다 작았다'에서 인용한 것이다. 내가 호기심을 갖고 있는 부분을 묘사한 문장을 찾아 보았다.

    막 적출된 안구는 흔히 영화 등에서 묘사되는 매끈한 탁구공 모양이라기보다는 안구의 절반 이상이 뒤쪽에 끈이 달린 치밀한 그물 같은 조직에 들어 있는 모습이었다. 끈은 안구에서 뇌로 이어지는 시각신경 다발이고, 치밀한 그물 조직은 눈을 둘러싼 근육들이었다. 

    내 생각이 맞았다. 망막은 당연히 안구와 일체이며, 안구 전체와 함께 움직인다. 안구의 회전에 따라서 시신경 다발이 얼마나 느슨해졌다가 팽팽해지는 것을 반복하는지는 알 수 없으나, 고정되어 있는 것이 절대로 아니다.

    PIXELSQUID 웹사이트에 가면 안구의 해부학적 3D 이미지를 직접 돌려 볼 수 있다. 

    수정체와 홍채는 현재의 카메라 기술로 비교적 쉽게 구현 가능할 것이다. 배터리 교체 문제의 해결 방안은 나도 잘 모르겠다. 혈액으로부터 공급되는 영양물질(예: 포도당)을 이용하여 전기 에너지를 발생하는 기술이 생긴다면 정말 유용할 것이다. 그런데 이는 이미 생체전지연료라는 이름으로 proof-of-concept 수준으로 구현이 된 기술이다('몸속에서 전기 생산하는 섬유전지 나왔다', 2018). 실용화 수준은 아직 찾아보지 않았다. 

    휴대폰에 들어가는 카메라 모듈을 생각한다면 직경 24 mm의 인공 안구에 넣을 시각 센서는 충분히 작게 만들 수 있다. 역시 전원 공급 방법을 해결해야 하고, 그 다음으로는 이를 시신경과 인터페이싱하는 기술을 해결해야 한다. 위에서 내가 제기한 문제는 단순 무식하게 인공 눈알 뒤에 마치 하네스 케이블과 같은 다발을 연결하는 경우를 상정한 것이다. 보다 현명한 엔지니어라면 이런 방식 대신 인공 눈에 붙은 센서와 시신경을 직접 연결하는 기술을 먼저 개발할 것이다.

    나는 염기서열 해독 결과를 매만지는 분자생물학자/유전체학자일 뿐, 눈을 인공화하는 현대 공학기술이 어느 수준으로 발전했는지는 전혀 알지 못한다. 자료를 조금 검색해 보니 디지털 카메라에 쓰이는 반도체 센서에 시신경을 인터페이싱하는 것은 말도 안되는 접근 방식으로 보인다. 차라리 스탠포드 의과대학의 The Stanford Artificial Retina Project 웹사이트부터 읽어 보는 것이 나을 것이다. 연구의 목표는 이식 가능한 인공 망막을 개발하는 것이다. 황반변성 등 요즘 점점 흔해지는 망막 질환을 생각하면 대단히 유용한 기술임은 자명하다.

    다양한 분야의 사람들을 만나서 상상의 지평을 넓히는 것은 정말 즐거운 일이다. 때로는 이런 만남이 선례에 집착하지 않은 창의적 발상을 하는데 도움을 준다.

    2024년 7월 14일 일요일

    Samson 파워드믹서 XML610의 테스트 - 프리부의 게인을 중심으로

     DI box를 통해 일렉트릭 베이스를 연결한 뒤 시험 연주를 해 보고 있다. 아내의 시점에서 촬영(의도하지 않게 찍힌 아내의 발은 'cropped out'). 바닥에 놓인 멋진 기타 이펙터 프로세서(BOSS GT-5)는 내 것이 아니다.


    일요일 아침, 중고로 구입한 파워드믹서를 임시 연습실(근무하는 빌딩의 지하 1층)에 가져다 놓고 테스트를 진행하였다. 우선 다이나믹 마이크로폰(카날스 BKD-101)을 1번 채널에 꽂은 뒤 채널 레벨을 거의 최대로 올리고 음성을 입력해 보았다. 생각보다 소리가 작다. 어지간히 큰 소릴 내도 레벨미터 LED(-10, -5, 0, +3, +6)의 가장 낮은 위치(-10)에도 불이 잘 들어오지 않았다. MASTER LEVEL은 12시 정도로 두었다. MASTER LEVEL을 올리면 당연히 레벨미터의 점등 수준도 올라갈 것이다.

    연습실에 자리 잡은 '삼손' 파워드믹서 XML610. 4옴 패시브 스피커에 대하여 정격 300 와트 x 2(0.1% THD at 1 KHz)의 파워를 낸다.

    Behringer Xenyx 802에서는 마이크로폰을 대고 소리를 입력하면 레벨 미터가 당연히 반응하였다. 레벨 미터의 LED는 -20, 0 +6, CLIP에 해당하므로, XML610보다 더 낮은 레벨에서 LED의 불이 들어오는 것으로 볼 수 있다. 

    그러나 두 장비의 프리앰프의 성능, 특히 게인 측면에서 차이가 있는 것은 아닐까? Behringer Xenyx 802의 마이크로폰 전용 채널인 1번과 2번에는 모든 채널 스트립이 공통으로 갖고 있는 최 하단의 레벨 조절 노브 외에도 다음과 같은 게인 조절 노브가 별도로 존재한다. 다이나믹 마이크로폰은 -10~+40 dB, 팬텀 파워를 공급했을 시 콘덴서 마이크로폰은 +10~+60 dB의 게인 조절 범위를 제공한다.

    Behringer Xenyx 믹서의 매뉴얼에는 이런 문장이 있다. "The XENYX preamps provide undistorted and noise-free gain as is typically known only from costly outboard preamps... They are perfectly matched to every conceivable microphone with up to 60 dB gain and +48 volt phantom power supply." 

    내가 갖고 있는 어떤 마이크로폰도 이 게인 노브를 12시 이상으로 돌리지 않고는 만족스런 레벨이 나오지 않는다. 콘덴서 마이크로폰은 조금 다르긴 하지만. 그리고 액티브 DI box를 경유하여 연결한 일렉트릭 베이스 역시 이 게인 노브를 올려 놔야 다른 악기와 합주를 할만 한 정도의 레벨이 된다. 컴퓨터로 녹음을 할 때에는 이 레벨 노브의 위치에 크게 의존하지는 않았다.

    자, 이 게인 노브는 Xenyx 802 믹서로 하여금 XML610보다 더 높은 수준의 사전 증폭을 제공하는 것일까? XML610에는 오직 레벨 조절 노브(패널에서는 'VOL'로 표시)와 -20 dB PAD 토글 버튼 스위치(채널 1-4)만 있을 뿐이다. 패드 버튼은 피크 LED에 불이 들어올 때 누르라고 되어 있다.

    Samson XML601의 프리부 전압 게인 사양을 살펴 보았다. 어느 채널이든 마이크로폰을 위한 추가적인 게인이 있는 것 같지는 않다. 

    신호가 다다르는 최종 출구에 따라 게인이 전부 다르다. 1-4 채널(마이크로폰)에 대해서는 36 dB 이득이라고 기억해 두면 되겠다. 

    반면 Behringer 믹서의 사용자 매뉴얼에는 Xenyx 프리앰프가 최대 +60 dB라고 하였으며, 라인 입력의 경우 grain range는 -10 dB to +40 dB라고 하였다. 국내 브랜드인 카날스의 믹서인 BKG-50의 사양을 살펴보면 게인 범위는 라인 입력의 경우 -10~+40 dB, 마이크로폰 입력의 경우 +10~+60 dB이다. 엠앤에스(미디앤사운드)에서 세일 중인 ICON NeoPreAmp는 마이크로폰 입력에 대하여 역시 60 dB의 게인을 제공한다. 따라서 Samson 파워드믹서 XML610이 제공하는 36~42 dB의 게인은 다소 낮다고 볼 수 있다. 그러나 다른 파워드믹서의 사양과 아직 비교해 보지는 않았으니 섣불리 결론을 내려서는 안된다.

    파워드믹서라는 물건은 어디까지나 편의성을 위해서 만들어진 것이므로 내장된 믹서 자체가 좋은 품질의 것이라고 기대해서는 안 될 것이다. 믹서와 파워 앰프가 하나로 합쳐진 장비로서 한 손으로 번쩍 들 수 있다는 것, 그 이상으로 뭘 더 기대할 필요가 있겠는가? 위에서 살펴본 것은 프리앰프부의 게인이 약간 낮다는 자체 평가이고(동등한 600와트급 파워드믹서가 일반적으로 어떠한 수준인지는 아직 잘 모름), 잡음 수준에 대해서도 많은 것을 기대하지 않는다. 


    팬텀 파워를 쓸 때에는 각별히 주의하자

    팬텀 파워는 콘덴서 마이크로폰이나 일부 액티브 DI box에 전원을 공급하기 위해 필요하다(내가 쓴 관련 글 링크). 액티브 DI box의 전원을 믹서 측에서 팬텀 파워의 형태로 제공하려면 아마도 XLR-XLR 케이블을 써야 할 것 같다. 실제로 내가 실험을 해 본 것은 XLR-XLR 케이블을 사용한 것이 유일하다. XLR-TRS 케이블도 갖고 있기는 하다. 

    Xenyx 802 믹서의 다이어그램(일부, 원본). 마이크로폰 전용의 채널 1번 및 2번에서는 6.35 mm (1/4인치) TRS 커넥터를 통해서 팬텀 파워를 공급하지는 못할 것으로 보인다. 팬텀 파워를 공급하려면 XLR 커넥터에 케이블을 꽂아라!


    어쨌든 팬텀 파워가 걸린 상태에서 마이크로폰 케이블을 연결하거나 뽑으면 좋지 않다는 것은 매우 잘 알려져 있는 주의사항이다. 특히 unbalanced 기기는 더욱 위험하다.

    다이나믹 마이크로폰이 꽂힌 상태에서 팬텀 파워를 걸면 어떻게 되는가? 만약 제대로 만들어진 XLR 케이블을 통해 연결되었다면 문제가 없다고 한다. 

    오늘 XML610에 콘덴서 마이크로폰을 연결한 뒤 팬텀 파워(+48 V)를 걸어서 소리가 잘 남을 확인하였다. 그런데 다른 채널에 연결되어 있던 다이나믹 마이크로폰 본체의 ON/OFF 스위치를 무심코 작동시켰다가 매우 큰 소리와 함께 갑자기 파워드믹서가 작동하지 않는 것 아닌가?

    "어이쿠, 사자마자 망가뜨린 것 아닐까?"

    떨리는 마음으로 본체의 파워를 내렸다가 다시 넣으니 정상적으로 작동하기 시작하였다. 전기적 충격에 의한 오동작이었는지, 또는 자체적인 보호 기능이 작동했는지는 알지 못한다. 

    2024년 7월 13일 토요일

    Samson 파워드믹서 XML610의 주요 사용법 공부하기

    XML610이 배달된 것은 이틀 전이었으나 아직 작동 테스트를 하지 못하였다. 스피콘 커넥터로 연결된 PA 스피커와 악기 등은 전부 직장(지하실)에 있지만 거듭된 출장으로 아예 가지를 못했기 때문이다.

    이전 모델로 추정되는 XM610(specification)은 채널 수도 6개에 불과하고 중량은 무려 18.2 kg이나 나간다. XML610이 6.5 kg밖에 나가지 않는 것은 class D amplifier를 채용했기 때문일 것이다. Hum & noise 사양은 구 모델인 XM610이 조금 더 우수하다.



    지금껏 사용해 온 Behringer Xenyx 802와는 달리 이펙터를 내장하고 있으므로 그 사용법을 잘 이해하는 것이 중요하다. 사용자 매뉴얼을 숙독하면서 Xenyx 802와 다른 점을 공부해 보았다. 

    채널 스트립을 따라 세로로 배치된 노브 중 3-band EQ 바로 아래에 위치한 파란색 AUX 1/MON은 pre-fader에 해당하므로 바로 아래 위치한 볼륨 컨트롤의 영향을 받지 않는다. 이 노브는 모니터 버스로 가는 신호의 양을 결정한다. 그 아래의 자주색 AUX 2/EFX는 post-fader이므로 볼륨 컨트롤의 영향을 받으며, 내부의 이펙터 프로세서와 EFX 2 SEND로 나가는 신호의 양을 결정한다. 외장 이펙터를 쓰려면 사용 가능한 5/6~11/12 채널의 6.5 mm TS 단자에 이펙터 출력의 케이블을 꽂아 넣어야 한다.

    AUX 1/MON과 AUX 2/EFX의 조절 노브를 확인하자.

    모니터 출력 단자는 전면 왼쪽 아래에 있다. 그러나 설정용 슬라이드 스위치('MODE')를 조절하여 오른쪽 채널에서 나오게 할 수 있다. 모니터는 메인 믹스와는 별도로 작동된다. 앞서도 설명했듯이 각 채널의 볼륨 레벨 설정과는 무관하다.

    전면의 MAIN OUT 단자는 라인 레벨 신호(+4 dBu)를 내 보낸다는 것을 명심하자. MONITOR OUT은 balanced(mono),  EFFECT(AUX 2) SEND는 unbalanced(mono) 출력이다.

    이펙터가 가해지는 정도는 (1) AUX 2/EFX, 이펙터 섹션의 (2) LEVEL, 그리고 7-band graphic EQ 왼쪽 부분에 위치한 (3) EFX 2 MAIN의 총 세 곳의 노브에서 결정하게 된다. 그러나 노브를 돌림으로써 얻는 조절의 실제 내용은 조금씩 다르다. (1)은 입력 신호를 얼마나 내부 이펙터로 보낼 것인가, (2)는 모든 입력 채널에서 전송된 신호를 합쳐서 내부 이펙터로 보내는 정도, (3)은 이것을 다시 메인 믹스에 합치는 양이라고 이해하면 된다. 노브를 12시 방향으로 놓으면 unity(=1), 즉 입력을 가감 없이 보내는 것이다.

    REC OUT(RCA 단자)은 graphic EQ를 거치지 않은 신호이다,

    스피커를 구동하지 않고 믹서 용도로만 사용해도 손색이 없을 것으로 생각된다. 반도체 파워 앰프에 스피커를 연결하지 않은 상태로 사용해도 문제를 일으키지 않는다.

    XML610 및 910 모델의 블록 다이어그램.
     


    밴드 연습을 잘 하기 위해서 더 필요한 것은 없을 것으로 믿는다. 당분간은...


    2024년 7월 14일 업데이트 - 사용 시 주의사항


    '24-Bit Digital Effects Section'의 EFX ON 스위치 작동이 원활하지 않다. 한번 누르면 쏙 들어가서 ON 상태가 되고 다시 누르면 튀어나와서 OFF가 되어야 하나, 이물질이 끼었는지 부드럽게 들락날락하지 않는다. 전기적 접촉 문제는 아닌 것 같다. 나중에 분해를 할 일이 있으면 내부 청소가 필요할 것 같다. 중고품이므로 이 정도의 결함 아닌 결함은 감수해야 할 것이다.

    48 볼트 팬텀 스위치를 팝 노이즈를 줄이기 위해 MASTER/MONITOR level control을 최소로 둔 뒤에 작동시키도록 한다. 



    2024년 7월 12일 금요일

    오픈 사이언스 시대의 연구데이터 공개 정책

    서울 출장에서 돌아와서 치과까지 들렀다 집에 오니 너무나 피곤하여 잠시 퍼져 있다가 노트북 컴퓨터의 덮개를 열었다. 어제(7월 11일) KISTI, 즉 한국과학기술정보연구원에서 열렸던 <2024 연구데이터 관리 및 활용 세미나>의 생생한 기억이 사라지기 전에 참석 후기를 쓰기 위함이었다.

    세미나가 열렸던 키움관 1층 컨퍼런스룸의 반대편에는 KISTI Studio가 자리잡고 있었다.

    '오픈 사이언스란 과학 연구의 결과물과 데이터, 방법론 등을 누구나 접근하고 활용할 수 있도록 공개하는 것을 의미한다'고 ChatGPT는 말하였다. 주요 원칙 중 1순위는 오픈 액세스, 즉 학술 논문(연구 결과물)을 누구나 무료로 읽고 다운로드하게 만드는 것이고, 두 번째는 오픈 데이터, 즉 연구데이터를 공개하여 다른 연구자들이 이를 재사용하고 검증할 수 있게 하는 것이다.

    오픈 데이터 정책은 가뜩이나 업무에 시달리는 연구자에게 부담을 하나 더 지우는 것은 맞다. 데이터를 정제하여 친절한 설명을 단 뒤에 정해진 리포지토리에 올리는 일은 논문이나 보고서를 쓰는 일 못지않게 수고스럽기 때문이다. 그나마 생명공학 분야에서는 서열 데이터 등을 전문 리포지토리에 올려서 공개를 해 놓아야만 학술지에서 논문을 받아 주는 전통이 잘 수립되어 있어서 이에 따르는 연구자의 저항감은 비교적 적은 편이다. 특히 국내에서는 국가 바이오 데이터 스테이션(K-BDS)이 그러한 데이터 리포지토리 역할을 수행하고 있으며, 등록 실적을 높이기 위해 많은 노력을 기울이고 있다.

    과학자가 얻는 기본적인 보상은 어떤 연구 결과를 누구보다도 먼저 발표하여 인정을 받는 것이다. 이를 위해서는 연구 결과(또는 데이터)의 개방이 근본 전제 조건이 되어야 한다. 그렇다면 데이터를 공유하는 과학자들은 학술적 크레딧을 얻고 있는가? 연구 데이터를 공유하게 만드는 정책은 연구 성과에 어떤 영향을 미치는가? 연구 데이터의 독점적 사용은 과학의 발전을 저해하는가? 이번 KISTI 세미나의 오전 세션에서 발표를 했던 성균관대학교 권석범 교수(논문 목록)는 이러한 질문에 대한 답을 얻고자 하였다. 

    발표 중인 권석범 교수. 죄송하게도 앞자리에 앉은 다른 발표자의 뒷모습이 찍혔다. 왼쪽부터 KAIST 이경찬 책임('IR 및 IDR 통합을 통한 연구데이터 서비스 방안 모색'), STEPI 신은정 박사('국내외 연구데이터 정책 동향과 과제').

    연구 방법론은 생명과학자인 내가 이해하기는 힘들었으나 결론은 이러했다. 

    • 데이터 공유 과학자의 연구 성과는 더 많이 인용되지만 시간이 흐를수록 인용회수는 더 적어진다. 이는 더 진보된 연구 결과가 등장하기 때문인 것으로 보인다.
    • 연구데이터를 공유(강제?)하는 정책은 연구 성과를 저하시키는 것 같지는 않다. 데이터를 인용하는 과학자가 데이터를 공개하는 과학자를 직접적인 경쟁 상대로 삼는 것은 좋은 전략이 아니기 때문이다. 이는 좋은 전략이 아니다. 이를 활용하여 다른 연구 질문을 해결하는 것(diversion)이 더 나은 선택이다.
    • 독점적 연구 데이터 활용은 나쁜 것만은 아니다. 다른 차원의 오픈 사이언스를 촉발할 수 있다. 

    권 교수의 결론은 '데이터 공개는 무조건 좋다'는 우리의 막연한 기대를 그대로 반영하지는 않았다는 점에서 매우 흥미로웠다. 데이터를 모두에게 공개하면 분명 이를 이용하여 이득만 취하는 무임승차자가 생길 수 있다. 데이터가 필요한 사람에게 독점적으로 제공하고 대가를 받는 direct exchange가 더 이득이라고 생각한다면 막을 길은 없다. 따라서 연구 데이터의 공유 활성화를 이루려면 분명히 정책적 지원이 필요하다. 연구 데이터의 공개가 어떠한 성과물을 창출하는지 분석할 수 있는 체계 또한 필요하다. 

    권 교수의 발표에서 다룬 본인의 연구 논문은 다음과 같다.

    • Incentive or disincentive for research data disclosure? A large-scale empirical analysis and implications for open science policy. International Journal of Information Management (2010)
    • Competition or diversion? Effect of public sharing of data on research productivity of data provider. (under review)
    • Dual role of data in corporate research on machine learning and artificial intelligence. (under review)

    지난해 과기정통부에서 <국가연구데이터 관리 및 활용 촉진에 관한 법률 제정안>을 입법예고하였으나 21대 국회와 함께 종료되었고, 22대 국회에서는 두 건의 법률안이 의원입법으로 다시 올라온 상태이다(복기왕의원 등 23인, 박충권의원 등 11인). 지금까지 쏟아져 나온 온갖 진흥법의 구조와 많이 닮은 것은 전자이고, 다른 법에서 보호하고 있는 정보를 포함하는 국가연구데이터에 대한 공개 제한 규정을 담은 것은 후자이다. 바이오헬스 데이터와 같이 생명윤리법 또는 개인정보 보호법의 적용 대상이 되는 데이터를 위한 배려(?)로 보인다.

    연구데이터와 관련한 법률이 생긴다고 모든 것이 명확해지는 것은 절대 아니다. 이미 공공데이터법(2013)과 산업 디지털 전환법(2022)이 있어서 공공데이터 및 연구데이터와도 영역 다툼을 벌여야 하기 때문이다. 예를 들어 공공데이터란 공공기관이 직무상 혹은 목적성을 가지고 생성·취득·관리하는 전자(기록)자료인데, 출연연이 생성한 연구 데이터 역시 이 범주에 당연히 들어가지 않겠는가.

    일단 이러한 법률이 제정되면 몇 년 단위의 기본계획 수립(너무나 많이 보아 온 방식), 데이터 플랫폼 구축 및 운영 등 고정적으로 예산을 받을 수 있는 구조가 만들어지니 한편에서는 이를 분명히 환영할 것이다. 국내외 연구데이터 정책과 법제도 - 동향과 과제에 대해서는 STEPI의 신은정 박사가 발표하였고, 이는 연구보고서인 <연구데이터 활성화를 위한 정책방향 및 법제와 전략 연구>(김권일 외 2023.9.)로 발표된 바 있음을 밝혔다. 

    이외에도 KISTI가 구축한 국가연구데이터플랫폼 DataON과 표준형 기관 연구데이터 리포지토리인 NaRDA(National Research Data Archive), 그리고 데이터 리포지토리의 인증 체계 중 하나인 CoreTrustSeal에 대한 소개도 있었다. 모든 발표를 듣느라 거의 하루를 꼬박 투자했지만 전혀 시간이 아깝지 않았다.

    연구데이터 공개가 진정으로 가치를 발휘하려면 연구자의 선의에 기대하는 것만으로는 충분하지 않다. 정책이 그 빈 팀을 잘 메워 주어야 하고, 실제로 어떻게 활용되고 있는지 면밀하게 추적해서 이를 평가해야 한다. 한국사회과학자료원(KOSSDA)의 데이터 인용 캠페인인 'Cite the data'가 떠오른다.

    KOSSDA 웹사이트의 팝업 창에서 '질적연구'라는 용어를 접했다. 부끄럽지만 질적연구라는 용어는 2년 전 국무조정실 규제혁신추진단에 파견을 나와서 다른 전문위원에게 처음 들었다. '당신들과 같은 논리실증주의자들은~'을 부르짖던 이 모 박사님이 생각이 난다.

    KOSSDA 웹사이트의 팝업 창. 이것이 요즘 사회과학의 연구 방법론이로구나...


    2024년 7월 11일 목요일

    [자작곡] 호수 섬 이니스프리, 버전 1(보컬은 synth로 대신함), 2, 3, 그리고 직접 노래를 부른 버전 4

    「호수 섬 이니스프리(The Lake Isle of Innisfree)」는 예이츠(1865-1939)의 시로 잘 알려져 있다. 예전에는 「이니스프리의 호도(湖島)」라는 제목으로 번역되었던 것으로 기억한다. 이 유명한 시를 가사로 삼아서 멜로디를 붙였던 것이 아마 중학교 1~2학년 무렵이었을 것이다. 그때는 '호도'라는 한자어가 호수 속의 섬이라는 뜻을 갖고 있다는 것도 몰랐다. 원작은 영시라서 번역본은 몇 가지가 있을 수 있는데, 내가 당시 작곡에 참고했던 것은 지나치게 짧게 의역이 되어 있었던 것으로 기억한다. 그 번역본(참고 링크)이 멜로디를 붙이기에는 적당했을 수도 있지만, 시어(詩語)의 뜻을 정확히 모른 채로 적당히 가공하는 실수를 하였었다. 이 시를 원작에 충실하게 번역한 것으로 여겨지는 것을 하나 소개한다. 복사를 허락하지 않아서 원본 링크로 대신한다.

    「이니스프리의 호수 섬」과 아일랜드의 자유와 독립

    이 시에서 우리말로 옮기기 가장 어려운 곳은 다음이라고 생각한다.

    And I shall have some peace there, for peace comes dropping slow,

    Dropping from the veils of the morning to where the cricket sings;

    나 그곳에서 얼마간 평화를 누리리라. 평화는 천천히 내리므로(방울지듯?), 아침의 베일(안개?)부터 귀뚜라미 우는 곳까지 'dropping'하는데...

    중학생 시절에 가사로 삼았던 번역본에는 '그러면 내 마음 평화로우리/안개 낀 아침부터 귀뚜라미 우는 저녁때까지'라고 하였다. 이는 지나친 의역이라고 생각한다. 하지만 그도 그럴 것이, 직역을 해 놓으면 우리의 정서에 잘 맞지 않으니 번역자도 무척 고심을 했을 것이다. 이 번역자는 '아침부터 저녁까지 평화롭다'고 읽히도록 옮겨 놓았다. 그러나 원래의 의미는 이랬을 것이다.

    (폭포수처럼 줄줄 흘러내리는 것이 아니라) 물방울이 맺혀 하나 둘 떨어지듯 평화가 내려오고, 그것을 나는 얼마간 누릴 것이고... 아침의 베일부터 귀뚜라미가 우는 곳까지 (평화가) 방울져 떨어지는데...

    Dropping from A to B라고 표현하였으므로 A와 B는 장소 또는 위치에 해당하는 낱말이 되어야 한다. 그러나 이 시에서는 의미상 시간을 뜻하는 어구(phrase)가 차지하고 있다. 영시에서는 멋진 표현일지도 모르지만 국문으로 옮기면 의역으로도, 직역으로도 그 아름다움이 잘 전해지지 않는다. 외국어로 쓰여진 시를 번역하는 사람은 정말 위대하다!

    음악을 만들고 녹음하는 취미를 새로이 시작하면서 중학생 시절에 너무나 대충 만든 이 포크송 스타일의 노래를 반드시 새로 고치겠다는 다짐을 하였고, 며칠 전에 초안의 녹음을 마쳤다. 가사는 원작에 맞게 손을 보았고 - 실은 몇 달이 걸렸으며, 아직도 계속 변경 중 - 새롭게 한 구절을 창작하여 추가하기도 하였다. 80년대 초에 만들었던 곡은 너무 짧았기 때문이다. 

    기억 속에만 남아 있던 40여 년 전의 자작곡을 녹음으로 남기겠다는 결심을 하게 된 것은 어린 시절 음악적으로 많은 영감을 주고 받았던 친구 JH와 비교적 최근에 카카오톡을 하다가 문득 이 곡을 기억하고 있다는 말을 들었기 때문이었다. 그 당시에 이 곡이 들을 만하였는지, 또는 그저 그랬는지에 관한 평은 미처 듣지 못했지만, 친구의 말에 용기를 얻어서 컴퓨터를 열고 녹음에 착수하게 된 것이다. 또 다른 자작곡인 「친구 JH에게 바치는 노래(+알란 파슨스 프로젝트의 Sirius를 뒷부분에 삽입)」의 가장 마지막 작업 버전은 작년 11월에 만들어 내 블로그에 올린 일이 있다(링크). 2014년에 나를 진공관 앰프의 길로 빠져들게 해서 아직까지 여기에서 헤매게 만든 것도 바로 JH였다. 매우 다행스럽게도 요즘은 다시 대출력 반도체 앰프의 길로 돌아오고 있다. 직장 동료들과 밴드를 결성해 합주를 하려니 이동이 쉽고 튼튼하며 일정 이상의 출력을 내는 앰프가 필요하기 때문에 어쩔 도리가 없다. 

    마이크로폰을 붙들고 목소리를 뽑아내기에는 아직 부족함이 있어서 sine wave로 보컬을 대신한 초안을 이 블로그에 공개한다. 내 유튜브 자작곡 목록에 올리기에는 아직 완성도가 많이 떨어진다. 보사노바 드럼 트랙은 유튜브에서 딴 것이고, 기타와 베이스 및 키보드는 직접 연주하였다. 7월 9일에 작성한 글 집단 지성을 발휘하는 올바른 방식에서 보였던 끔찍한 오디오 클립 편집 작업이 바로 이 곡에 해당한다. 사실 스케치 수준의 녹음이라서 블로그에 올리기에 민망한 면이 없지 않다. 신서사이저는 AKAI MPK mini로 대충 연주했더니 영 엉망이다. 미니 건반 특유의 불편함에, 스펀지 같은 작동으로 벨로시티를 원하는 수준으로 컨트롤하는 어려움이 더해진다. 그러나 기타릭 플레이어로 뽑은 소리는 나쁘지 않다.



    조만간 일일 보컬 교습을 받은 뒤 녹음을 해 보려는 야심에 찬 계획을 가슴에 품고 있다. 원래 C 메이저였던 곡이 A 메이저가 되어서 장6도가 올라갔으니 '특별 수련'이 필요하지 않겠는가? 일반인에게는 별로 높은 곡이 아니지만, 나에게는 조금 어렵다.


    2024년 7월 21일 업데이트(유튜브 공개, 그 후)

    다음은 유튜브에 처음 올린 7월 20일 버전(v2)이다.


    서둘러 올리고 나서 다시 들어보니 기타 솔로 연주 중에 영 마음에 들지 않는 딱 한 마디가 있어서 이를 재녹음하였다(버전 3). 곡 구조상으로는 몇 차례 반복이 된다. 다음의 유뷰트 공개 버전은 보컬을 녹음한 후가 될 것이다.



    2024년 8월 3일 업데이트

    직접 노래를 불러서 녹음을 하여 만든 버전 4를 유튜브에 올렸다. 악플이 달리지 않을까 두렵다! 다이나텍 오메가 마이크로폰을 사용하였다.



    ㅁㄴㅇ


    2024년 7월 10일 수요일

    Tracktion Waveform Free, 무엇이 달라졌나?

    Tracktion Software Corporation의 Waveform FreeAudacity와 더불어 내가 가장 즐겨 사용하는 음악 작업용 소프트웨어이다. 둘 다 무료이지만 아마추어가 사용하기에는 별로 불편한 점이 없다.다. Waveform Free로 손질을 하여 유튜브에 자작곡 '2023년 광화문 광장의 여름' 을 올린 것이 벌써 4개월 전이라 사용법이 조금씩 기억나지 않는 상태가 되었다. 열심히 줄을 그어가며 공부했던 매뉴얼은 2021년 2월에 배포된 것이라서 최신 버전인 12.X와도 잘 맞지 않는 상태가 되었다.



    요즘 다시 자작곡 녹음 작업을 재개하면서 Waveform에 어떤 변화가 생겼는지 확인해 보았다. Free 버전은 정식 버전을 0.5 정도 뒤쳐져서 따라가고 있는 것으로 안다. 지난 봄에 출시된 Waveform Pro는 버전 13에 해당한다. 여기에 추가된 기능은 공식 웹사이트의 글 What's New in 13을 참조하자. 오디오 또는 MIDI 클립을 엑셀 챠트와 같은 곳에 그리드 형태의 작업 창에 자유롭게 끌어다 놓고 직관적으로 작업을 할 수 있게 만드는 Clip Launcher, 새로운 컨트롤러 지원, wavetable synth 등이 추가된 기능이다. Version 13용 유저 가이드(2024)가 공개된 것도 정말 반가운 일이다.

    Waveform Free는 30~50 달러에 확장 기능을 넣을 수 있게 되었다('Waveform Free Expansion'). 모든 확장 기능을 다 구입하면 Waveform Pro와 비슷해지는 것인지는 잘 모르겠다. Sound pack과 construction kit는 개당 10달러이다('Content Sound Packs'). 확장 가능한 음원을 사용하려면 Waveform Free Expansion의 하나인 MIDI Producer가 제공하는 Multi Sampler가 필요하다. 무료 VSTi 같은 것을 모으려고 애쓸 것이 아니라 이런 것을 가끔 구입하여 활용하는 것이 더 나을런지도 모른다. 

    궁극적으로는 1인 아마추어 뮤지션을 꿈꾸고 있지만, 요즘은 밴드를 하면서 같이 모여서 음악을 하는 즐거움을 누리기도 한다. 분위기를 조성한 당사자가 바로 나이므로 공용으로 쓸 음향기기를 자꾸 내가 구입하는 즐거움을 요즘 자주 누리고 있다. 힘겨운 서울 출장 후 집에 돌아오니 문 앞에는 Samson XML610 파워드 믹서(중고)가 떡 버티고 있다. 드디어 12인치 PA 스피커를 충실히 구동할 앰프를 갖추게 된 것이다. Behringer Xenyx 802에 보컬용 마이크 두 개, 기타 두 대, 베이스 한 대를 연결하려고 복잡하게 고민을 할 필요가 없어졌다. 게다가 인터엠 R150Plus로는 부족했던 출력 문제를 해결해 주었고, 더불어 이펙터를 내장하고 있으니 금상첨화! 매뉴얼은 ManualsLib에서 다운로드하면 된다.

    Samson XML610 12-channel stereo powered mixer. 



    2024년 7월 9일 화요일

    집단 지성을 발휘하는 올바른 방식

    '집단 지성'이라고 하면 위키를 이용한 공동 문서 작업이 우선 떠오른다. 위키백과에서 집단 지성을 찾아 보았다.

    집단 지성(集團知性, 영어: collective intelligence, group intelligence)은 다수의 개체들이 서로 협력 혹은 경쟁을 통하여 얻게 되는 결과를 말한다. 집단지성은 연구 분야의 하나이며, 누구나 수정할 수 있기에 조작과 왜곡이 되기 쉽다. 누구나 수정할 수 있는 위키들이 집단 지성의 대표적인 예시이다.

    경쟁이 집단 지성을 만드는 한 요소라는 것은 처음 알았다. '경쟁심'을 갖는 것 그 자체는 나쁜 일이 아니다. 예를 들어 위키로 문서를 작성하는 작업에서 다른 사람이 쓴 것을 보고 '나도 이만큼은 할 수 있어. 아니, 더 잘 할 수 있어!'라는 생각을 갖고 더욱 노력하여 좋은 글을 더한다면, 결과적으로는 모두에게 이익이 된다.

    그렇지만 지나친 경쟁은 협동을 저해하는 요인이 되기도 한다. 경쟁의 목표는 내가 상을 차지하는 것이기 때문이다. 그렇기 때문에 주변과 더욱 담을 쌓고, 타인에게 도움이 될 만한 것을 일체 공유하거나 흘리지(?) 않으려고 노력을 하게 된다. 

    ChatGPT에게 집단 지성이 무엇인지 물어 보았다. ChatGPT는 경쟁과 같은 낱말은 나열하지 않았다.

    집단 지성은 여러 사람들의 지식, 의견, 경험 등을 모아 하나의 문제를 해결하거나 새로운 아이디어를 도출하는 것을 말합니다. 이는 개개인의 지식과 능력을 합쳐 보다 나은 결과를 도출하는 방식으로, 공동의 지혜를 통해 복잡한 문제를 해결하거나 창의적인 해결책을 찾는 데 효과적입니다. 대표적인 예로는 위키피디아, 오픈 소스 소프트웨어 개발, 집단 브레인스토밍 등이 있습니다.

    요즘 들어서 무슨 위원회나 협의체 때문에 불려 다니는 일이 많다. 한 장소에 여러 사람이 모여서 머리를 맞대고 있으니 명목상으로는 집단 지성이 발휘될 것만 같다. 그러나 모임 자체에 자발성이 없다는 것이 큰 문제이다. 집단 지성이 발휘되려면 참여한 개개인의 창의성이 중요한데, 억지로 모여서 회의실에 둘러 앉아서는 창의성이 잘 나오지 않는다. 

    이 일을 통해서 사회 전반에 걸쳐 더 많은 이익을 누릴 수 있을까? 이런 목적의식을 앞에 두고 머리를 짜는 것이 아니라 위에서 던진 주제를 정해진 기한 내에 해결하여 가시적으로 성과를 내는 것이 급선무라면, 신체의 모든 구멍에서 창의성이 주체할 수 없이 흘러 나오려고 하다가 도로 들어갈 것이다. 

    원래 창의성이란 업무와 관련이 없는 분야에서 활활 타오르는 법이다. 예를 들어 그저께 밤에 집에서 녹음 클립을 편집하는 것과 같은.

    최근 자작곡 편집 화면(Tracktion Waveform Free 12.5)곡의 기준 템포와 관련이 없이 즉흥적으로 녹음한 기타 연주 클립을 특정 BPM에 맞추려니 이렇게 되고 말았다. 다시 연주해서 재녹음을 하면 되지만, Guitar Rig에서 우연히 찾은 쫀득쫀득한 소리를 재현할 수 있을지 자신이 없다. 어떤 기타를 썼었던가? 그것도 기억이 나지 않으려고 한다. 이 일은 철저히 개인적인 것이므로 오늘 글의 주제인 집단 지성과는 관계가 없다.


    협력 의제? 그런 거 생각해 두지 않았는데....

    2024년 7월 4일 목요일

    대장균 C strain은 Crooks strain의 별칭이 아니었다

    게놈 고물상 영업을 시작하면서 다른 사람이 10년 전에 쓴 논문에서 오타를 발견해 내고는 잠시 학문적 희열(?)을 느낀 적이 있었다. 돌이켜 보면 '누워서 침뱉기'나 다름이 없었다. 그 논문에서는 내가 공동 제1저자였기 때문이다... 그리고 부끄러운 일을 하나만 더 고백하자면 나의 경력에서 큰 의미가 있는 첫 논문에서는(당연히 내가 제1저자) 초록에 오타가 떡하니 들어간 상태로 인터넷에 박제가 되어 있다. 그것도 어떤 생명체의 학명, 즉 고유명사를 잘못 기록했으니 그 미생물에게는 매우 실례가 되는 일이다. 

    오늘 이와 비슷한 나의 실수를 또 찾아내고 고해성사를 올리는 글을 써 보겠다. 연구실에서 널리 쓰이는 유명한 대장균 중에는 K-12, B, W 등이 있다. 'C' 균주는 Crooks strain의 약칭일 것이라고 짐작하고 몇 편의 논문에서 이 균주의 약칭을 잘못 쓴 일이 있다. KCTC에서 분양을 받을 때에는 KCTC 2571이라는 번호를 이용하였다. ATCC 카탈로그 번호는 8739. 박테리오파지를 사용하던 분자유전학 태동기의 실험에서 대장균 균주를 K나 B라는 이름으로 불렀으므로, 알파벳 한 글자로 이루어진 약자를 쓰는 것이 대장균 활용 업계의 관행이라는 오해가 들 만도 하다. 나는 오늘까지 내가 연구에서 사용한 균주가 C strain이라고 생각했었는데, 실제로 이는 Crooks strain이며, C strain은 전혀 다른 녀석이었다.

    대장균 W strain('Waksman's strain, ATCC  9637)의 유전체 해독 및 게놈 스케일 대사 네트워크 구성 논문(BMC Genomics, 2011년)에서도 나는 열심히 454 read에서 만들어진 contig를 fosmid end read로 얽어서 스캐폴드를 만들고 열심히 finishing을 했었다. 이 논문에서도 이런 문구가 나온다. Lonnie O. Ingram 그룹에서 처음에 Crooks strain의 유전체를 해독하여 논문을 발표할 당시에 Crooks strain을 C strain이라고 표기한 것이 문제의 발단인 것으로 보인다.  

    When it was sequenced in 2007, ATCC 8739 was designated as a C strain [PMID 17972330], however, it is in fact a Crooks strain [4] and recent publications have reflected this correction [PMID 19918073, 19837840]. Of these five safe strains, K-12 [11], B [12] and Crooks [GenBank:CP000946] have been sequenced, but C and W have not.

    논문 공저자의 역할이 뭔가? 내가 만든 데이터로 그림과 표를 잘 만들고 이에 부속되는 본문을 잘 쓰는 것도 중요하지만, 논문 전체를 다 읽어 보면서 잘못된 것은 지적하고 미처 모르던 것을 발견하면 이를 잘 소화하여 내것으로 만들어야 하지 않는가? 만약 2011년 출판된 당시의 논문을 보다 더 세밀하게 읽었다면(게다가 나는 이 연구에 참여한 논문 공저자가 아닌가) Restrictionless strain으로도 알려진 대장균 C strain은 Crooks strain이 아니라는 것을 진작에 깨달았을 것이다. 진짜 대장균 C strain의 유전체 해독 결과는 비교적 최근이라 할 수 있는 2019년에 발표되었다(Król 등, PMID 31640553). 논문 초록을 인용해 보면 다음과 같다.

    Escherichia coli C forms more robust biofilms than other laboratory strains. Biofilm formation and cell aggregation under a high shear force depend on temperature and salt concentrations. It is the last of five E. coli strains (C, K12, B, W, Crooks) designated as safe for laboratory purposes whose genome has not been sequenced.

    실험 목적으로 사용하기에 안전한 다섯 대장균 균주 형제인 C, K-12, B, W, Crooks를 기억해 두자. 바로 위에서 소개한 논문을 읽어 보면 C 균주가 언제 분리되어 쓰이기 시작했는지 설명해 놓았다. 조금 더 검색을 해 보니 2018년 Microbiology Resource Announcements에 C 균주의 gapless genome sequence가 발표된 일이 있었고(Pekar 등, 논문 링크), 이 논문에 의하면 draft 수준의 최초 게놈 서열은 2016년에 GenBank accession NMKV00000000으로 발표된 일이 있었다고 한다. Król 등의 2019년 논문에서는 Peka 등의 2018년 논문을 언급하지 않았다. 알고서도 언급을 하지 않은 것인지, 또는 아예 몰랐는지? 그건 누구도 모른다.

    오늘 우연한 발견으로 위장한 과거의 실수 고백은 K-BDS(국가바이오데이터스테이션)에 등록할 대장균 B 균주 관련 자료를 정리하다가 빚어진 일이다. 유전체 비교 목적으로 K-12 MG1655의 염기서열을 샅샅이 훑어본 것이 벌써 2005년도이다. 당시에 공개된 자료인 NC_000913.2의 길이는 4,639,675 bp였는데, 현재 버전인 NC_000913.3은 4,641,650 bp이다. 무려 2 kb 가까이 늘어났다. 미생물 유전체 입장에서는 실로 엄청난 업데이트에 해당한다. 2010년 이전에 이미 충분한 정확도를 확보한 상태로 데이터 베이스에 제출된 염기서열이 '고정'되었을 것으로 생각했으나 그렇지가 않다. GenBank flat file을 앞부분을 살펴보니 2013년 11월 3일에 현재 염기서열로 바뀌었다고 한다. 나중에 심층적으로 조사하고 글을 쓸 거리가 또 하나 늘어났다.

    유명한 연구용 대장균 5종 세트 중 B에 속하는 BL21(DE3)와 W의 유전체를 내 손으로 해독하였으니 그것에 대해서는 자부심을 가져도 좋을 것이다. K-12 계열 중 하나인 HB101로 생각하고 잘못 구입한 RR1(HB101 RecA+)도 내가 해독하였지만 인용 회수가 별로 많지 않아서 실망스럽다.


    같은 날 오후에 작성한 업데이트

    2013년에 이루어진 대대적인 K-12 MG1655의 유전체 염기서열 업데이트에 관한 설명이 위스콘신-매디슨 대학의 E. coli Genome Project 웹사이트에 소개되어 있었다. 새로운 IS1 삽입이 아주 큰 이벤트였다. 관련 논문을 아직 읽어 보지는 않았기에, 이것이 최근에 일어난 IS transposion인지 또는 stock-to-stock variation을 반영한 것인지는 알 수 없다. 

    Sequence update (September 26, 2013)

    Monica Riley 등이 쓴 논문 Escherichia coli K-12: a cooperatively developed annotation snapshot - 2005(Nucleic Acids Research 2006, Vol. 34, No. 1, 1-9)에 이런 문구가 있다.

    We refer to this outcome as a ‘snapshot’ to emphasize that information about E.coli genes and their products are a moving target, and overtaken rapidly with more recent information.

    이 논문에서는 최신 유전체 주석화 성과를 '움직이는 타겟'이라고 하였지만, 염기서열 자체가 바뀐다는 것은 타겟 아래의 지면이 움직이는 것과 마찬가지의 큰 사건이다. 이 움직이는 타겟을 수십 년 동안이나 애정을 갖고서 들여다 본다는 것이 정말 대단하다. 그러한 대가들의 노력과 성과를 단 0.5%라도 따라 갈 수만 있다면 좋겠다.


    2024년 7월 9일 업데이트

    대장균 K-12 MG1655 유전체 염기서열의 지난번 업데이트에 관한 이야기는 2020년에 글로 작성해 둔 적이 있었다(대장균 K-12 MG1655의 유전체 서열 히스토리). 지금 다시 읽어보니 왜 이렇게 새롭게 느껴지는 것일까?


    2024년 7월 1일 월요일

    ChatGPT가 내 블로그의 자료까지 거두어 가서 학습을 하는 것 같다

    따라서 나는 정확한 내용에 기초한 글을 작성할 사회적 책임이 있다? 

    ChatGPT에게 "NCBI SRA에는 인간 유전체 정보가 얼마나 수록되어 있습니까?"라는 질문을 던져 보았다. SRA의 자료는 특별히 다운로드하는데 제한을 걸지 않으므로, 1000 Genomes Project와 같이 아예 공개할 목적으로 생산한 정보 외에는 sequencing raw data가 별로 없을 것이라고 생각하였다. 그런데 답변이 아주 흥미롭다.



    아니, 내 블로그를 참조하여 답안의 일부를 작성했단 말인가? 답변 중  NCBI 및 NCBI Trace는 마우스를 가져가서 클릭하면 해당 URL로 이동한다. 그러나 내 블로그 링크는 그렇지 않았다. 블로그에 작성된 특정 글이 아니라 블로그 타이틀 자체를 인용하였는데, 아쉽게도 연결은 되지 않는다. 

    기분이 정말 묘하다. 어차피 공개된 공간에 글을 쓴다는 것은 누구든지 그 글을 읽고 지식으로 삼을 수 있다는 뜻이다. 따라서 되도록이면 정확한 사실에 근거하고 어느 한편으로 치우침이 없는 글을 쓰는 것이 중요하다. 

    구글 검색 엔진이 내 블로그의 글을 가져다가 검색 결과로 보여주는 것에 대해서는 별다른 저항감이 없다. 그러나 ChatGPT가 대답을 하기 위한 학습용 데이터로 사용하리라고는 생각하지 못했다. 내가 허락하지 않았는데 왜 가져다 쓰냐고 불평을 하는 것은 아니다. 글 하나에 대해서 단돈 1원이라도 받고 써야 한다고 주장하는 것도 아니다. 어차피 나도 구글을 별로 큰 돈 들이지 않고 이용하고 있지 않은가. 어차피 누군가 검색하여 읽고 활용할 것으로 기대하고 세상에 도움이 되기를 바라는 목적으로 글을 쓰고 있으니까 말이다.

    마치 학술논문과 같이 인용한 자료에 대한 URL을 제공하는 것은 객관성을 보장하기 위한 ChatGPT 나름의 보완책이라고 여겨진다. 이를 잘 이용하면 개인 브랜드를 널리 알리는 데에 도움이 될지도 모르겠다. 그러나 노이즈 마케팅이 이런 분야에 통할 리는 없다. 

    미처 모르던 사이에 세상이 참 많이 변했다.