2025년 6월 4일 수요일

거버넌스(governance)의 의미를 정확히 알고 쓰기, 그리고 데이터 거버넌스 이야기

'거버넌스'라는 영단어의 뜻을 찾아 보았더니 '협치'라는 풀이가 튀어나와서 적잖이 놀랐던 적이 있었다. 'govern'이 '통치하다, 지배하다' 정도의 뜻을 갖고 있으므로 당연히 이와 유사한 뜻의 명사형이 나올 것이라고 생각했기 때문이다. 'goven'에서 유래한 명사는 'governance'뿐만이 아니라 'government'(정부)도 있다. 미리암-웹스터 사전에서는 governance를 다음과 같이 정의하였다.

governance the act or process of governing or overseeing the control and direction of something (such as a country or an organization)

어떤 조직의 '지배구조'라고 해야 할 곳에 그저 '거버넌스'라는 낱말을 넣어서 멋있게 보이는 글을 만드는 사람도 있는 것 같다. 도대체 '거버넌스'가 무엇인가? 공법학연구 제22권 제2호에 실린 양천수의 2021년 논문 데이터법-형성과 발전 그리고 과제-를 읽다가 225쪽에서 이와 관련한 글이 있어서 원문의 일부를 그대로 인용해 본다. 굵은 글씨와 밑줄은 내가 추가한 것이다.

데이터법은 최근 데이터에 관해 논의의 초점이 되는 데이터 거버넌스(data governance)를 구현하는 중요한 구성요소가 된다. 여기서 데이터 거버넌스는 간략하게 말하면 데이터를 관리 또는 규율하는 체계로 이해할 수 있다. 다만 데이터 거버넌스를 구체적으로 어떻게 파악할 것인지는 이에 전제가 되는 ‘거버넌스’(governance)를 어떻게 이해할 것인지와 밀접한 관련을 맺는다. 거버넌스는 보통 정부를 뜻하는 ‘거번먼트’(government)에 대립하는 개념으로 제시되었다. 폐쇄적인 관료제로 구성되는 거번먼트와는 달리 거버넌스는 외부와 네트워크로 연결되는 열린 조직을 추구한다. 그 때문에 상명하달 형식의 수직적인 소통이 주류를 이루는 거번먼트와는 달리 거버넌스에서는 상호이해와 참여, 협력을 기반으로 하는 수평적 소통이 중심이 된다. 요컨대 전통적인 거번먼트가 팽팽하고 경직된 조직과 수직적 소통에 바탕을 둔다면 거버넌스는 느슨하고 탄력적인 조직과 수평적 소통에 바탕을 둔다.

거버넌스를 지배구조라는 용어와 동일시하게 된 것은 corporate governance(기업 지배구조)라는 용어의 영향인 것으로 보인다. 여기에서의 지배구조는 기업을 운영하고 의사를 결정하기 위한 주주/이사회 중심의 통제 구조를 뜻한다. 반면 거버넌스는 어떠한 조직 외부의 이해관계자 참여까지 포함하는 열린 개념이다. 그러니 이를 '협치'라고 뜻풀이를 해 놓은 것은 최선은 아니더라도 차선은 되는 셈이다. 그렇다 해도 '데이터 협치'라고 해 놓으면 너무 어색하다. 어쩔 수 없이 영단어를 소리나는 그대로 한글로 옮겨서 적지만, 이렇게 함으로써 한글의 발전과 확장 가능성을 스스로 차단하는 것 같아 씁쓸하다.

ChatGPT에 따르면 지배구조는 governance as control이고, 거버넌스는 governance as process이다. 다시 설명하자면 오늘날 거버넌스의 올바른 의미는 어떤 조직, 시스템, 네트워크가 의사결정하고, 책임을 지며, 자원을 배분하고, 규범을 따르는 방식 전체를 말한다.

2014년 포브스에 실렸던 Jacob Morgan의 글 'Privacy is completely and utterly dead, and we killed it'을 음미하다가 이번에는 Personal Genome Project(PGP)로 대표되는 '정보를 공유할 권리(right ti share)'에 매료되어 본다. 아, 지조가 있어야 하는데 이렇게 '스윙'까지 해서야 되겠는가... 이번 제21대 대통령 선거에서도 언론 매체를 통해 '스윙(보터)'이라는 표현을 많이 보게 되었다. 우리말을 가다듬고 쓰임새를 늘림과 동시에 새로운 낱말을 갈고 다듬으면 안 되나?

2025년 6월 2일 월요일

ChatGPT에서 PDF를 만들기에 적합한 한글 TTF 글꼴은?

최근 읽은 책 <사생활의 역사>와 <리커넥트>. 오른쪽 짹은 '은둔'과는 또 다른 문제인 사회적 고립에서 벗어나는 방법을 다루고 있다. 두 책이 독자에게 보내는 메시지는 사뭇 다르다. <리커넥트>를 읽고 있노라면, 마치 나는 세상을 잘못 산 것 같은 착각에 빠진다.

정보화 사회가 AI 기술을 만나면서 데이터의 중요성이 더욱 부각되고 있다. 소셜 미디어가 워낙 대중화되어서 더 이상 사생활은 없고, 누구나 경제적 가치와 교환할 수 있다면 자기의 데이터를 넘길 자세가 되어 있는데 우리나라에서는 유난히 규제가 심하다는 논조의 글을 나 역시 종종 써 왔다. 그러나 국가 권력이 여기에 얼마나 개입을 해야 할까? 안보라는 명목으로 개인을 감시해도 될까? 이런 고민을 하다가 데이비드 빈센트의 <사생활의 역사>(원제: PRIVACY: A Short History)를 읽었다. 가장 중요하다고 할 수 있는 맨 마지막 장인 '조지 오웰, 스노든, 다음은?'에서 인용한 몇 편의 참고문헌을 찾아서 한글 번역을 시도하였다. 당연히 작업 도구는 ChatGPT이다. 회색으로 표시한 글은 공백을 포함하여 약 310자 이내로 작성한 요지이다.

William L. Prosser. Privacy. California Law Review 48(3):383, 1960.

사생활 침해를 법적으로 보호해야 한다는 논의가 법적 체계 내에서 어떻게 발전해왔는지를 분석합니다. Prosser는 네 가지 유형(사생활 침입, 공개된 사실, 허위조명, 사적 이익의 무단 이용)으로 사생활 침해를 분류하고, 이를 토대로 명확한 법적 보호 체계를 정립하려 시도합니다.

A. Michael Froomkin. The Death of Privacy? Stanford Law Review 52:1461, 2000.

정보기술과 감시기술의 발전으로 인해 개인 정보 보호가 점점 불가능해지고 있음을 경고합니다. 일상적 감시, 생체인식, 온라인 추적 등 기술이 사생활을 침식하고 있으며, 기존의 법률과 제도는 이를 따라가지 못합니다. 다만 다양한 기술적·법적 조치를 통해 완전한 붕괴는 막을 수 있다고 제안합니다.

Jacob Morgan. Privacy is Complely And Utterly Dead. And We Killed It. Forbes 2014년 8월 19일.

현대 사회에서 개인이 자발적으로 데이터를 공유하며 프라이버시의 종말을 초래했다는 논지를 전개합니다. 감시의 주체는 정부뿐 아니라 개인 자신이며, '죽은 프라이버시'는 단순히 피해자의 문제가 아닌 사회적 선택의 결과임을 강조합니다.

이 분야에서는 매우 유명한 논문(마지막 것은 논문은 아님)인 것 같다. 독후감과 더불어 이 자료를 음미한 바에 대한 글은 나중에 생각을 더욱 정리한 다음 별로로 작성해 보겠다.

ChatGPT에 PDF 파일을 각각 밀어 넣은 뒤 한글 번역본을 역시 PDF로 제공하라고 하였더니, 어떤 문서에 대해서는 그런대로 잘 만들어 내다가 또 어떤 문서는 한글이 아예 표시되지를 않았다. 왜 그런지를 물었더니 다음의 조건을 만족하는 글꼴을 직접 밀어 넣어야 된다는 것이다.

  • TrueType Font(.ttf) 형식
  • 유니코드 범위가 완전하고
  • 단순한 글꼴 구조(복잡한 OpenType 기능이나 CID 맵핑 없음... 무슨 소리인지?)
  • 라이선스가 자유롭고 경량화된 들꼴

ChatGPT에서 한글을 포함하는 PDF 문서를 만들려면 FPDF(단순 문서, 요약 등 간단하고 빠른 작업)이나 ReportLab(논문, 서식지, 다단 문서, 표 포함 문서 등)이라는 것을 써야 하는데, 그 성능에는 조금씩 차이가 있다. 둘 다 파이썬에서 PDF를 생성해 주는 것으로, 앞의 것이 매우 가볍고 빠른 경량 라이브러리이고(원래 PHP용으로 개발) 뒤의 것은 전문적인 PDF 문서를 생성하는 강력한 엔진이라고 한다. 안타깝게도 윈도우 기본 한글 글꼴로는 문제를 일으키는 경우가 많다고 한다. 따라서 다른 무료 글꼴을 사용하는 것을 권장한다. 



권장 글꼴 조합은 다음과 같다. 


예전에 워드 클라우드를 만들 때에는 파이썬 라이브러리를 직접 업로드해야 했는데, 이번 PDF 문서 생성 작업에서는 그걸 요구하지는 않는다. 반면에 글꼴은 넣으라고 한다. ChatGPT가 모든 것을 다 알아서 해결해 주면 좋겠지만 라이선스 문제가 있으니 사용자가 중간 과정을 처리해 줘야 하는 것 같다.

다음은 나눔고딕(Regular/Bold)를 적용하여 ReportLab으로 만든 문서의 스크린샷이다. 처음 시도했던 결과물에서는 줄바꿈이 되지 않고 줄 간격이 16pt로 다소 좁아서 이를 개선해 달라고 하였다. 줄 간격은 24pt로 늘렸고, 문단 사이 간격도 더욱 늘려서 가독성을 좋게 하였다.



ChatGPT에 작업을 요구할 때에는 아주 구체적으로 해야 한다는 것을 다시금 깨달았다.

2025년 6월 1일 일요일

[KORG X2] 드럼킷과 관련한 궁금증

KORG X2/X3에는 총 4개의 편집 가능한 드럼킷(Drum Kit)이 존재한다. A09(Total Kit), A69(ProducrKit), B09(Rave Kit), 그리고 B69(VeloGated)이다. GM 뱅크의 129번-136번에 해당하는 8개의 킷은 편집을 할 수 없다.

X2/X3 Basic Guide 48쪽에는 다음과 같이 4개 킷의 음색 배열이 수록되어 있다.


각 킷에서는 60개의 키 인덱스에 000(Fat Kick)부터 163(Metronome2)까지 총 164개의 드럼 사운드를 매핑해 놓았다. 그런데 나의 X2를 X2P internal preload data로 재설정해 놓은 뒤 실제로 드럼 소리를 들어 보니 여기에서 소개한 배열과 다르다는 것을 발견하였다. X3보다 나중에 출시된 X2에서 분명히 변화를 준 것은 맞는데, 어떤 점이 더 강화되었는지는 문서 등으로 공개되지 않았다. 

Reference manual 170쪽에 의하면 드럼킷 설정은 Global 7A(Drum Kit Setup1)과 7B(Drum Kit Setup2)에서 다루게 되어 있다. 하지만 왜 설정 메뉴가 두 개나 있는지 모르겠다. 왜냐하면 7A-1 모드에서 A1, A2, B1 및 B2를 전부 로드할 수 있기 때문이다. 

인터넷에서 구한 X2/X3용 음색 설정 디스크 중에서 여러 악기로 구성된 완전한 곡이 아니라 드럼 패턴만 수록한 것은 XSD-15 Power Disk가 유일하다. 이 디스크 안에서 X3DRUMS 설정을 로드한 뒤, X3DRUMS.SNG를 시퀀서로 로드하면 S0-S9의 10개 곡 데이터를 얻게 된다. 플로피 디스크 드라이브는 망가졌으므로 .PCG 및 .SNG("X3DRUMS.SNG") 파일을 SysEx로 전환한 뒤 MIDI 케이블을 통해 전송하는 방법을 택해야 한다. 이렇게 설정을 바꾼 상태에서 9개의 곡을 차례로 재생하여 녹음해 보았다.


그러면 이 시퀀스 데이터는 XFD-02 Internal Preload Data 디스크의 X3P_LOAD 설정과 잘 맞는가? 이것으로 설정을 되돌린 뒤, X3DRUMS.SNG를 다시 전송하여 각 곡을 재생해 보면 S1-S5는 소리가 맞지 않는다. 이 시퀀스를 제작한 사람은 X3의 기본 드럼 소리가 마음에 들지 않았던 모양이다. 

KORG X2가 드럼 머신으로서 탁월한 장비는 아니다. 만약 내가 '손가락 드럼'에 진정 관심이 있다면, 이미 보유하고 있는 AKAI MPK mini를 공부하는 것이 투입한 노력 대비 성과의 측면에서는 더 나을지도 모른다. 그러나 비록 구식 장비이기는 하나 음원으로부터 내장 시퀀서까지 모든 것을 다 갖춘 Music Workstation도 그 나름대로의 매력이 있다.

시퀀스 데이터에서 드럼 패턴을 복사에서 재사용 가능하게 만들어 보고 싶다.