2025년 6월 2일 월요일

ChatGPT에서 PDF를 만들기에 적합한 한글 TTF 글꼴은?

최근 읽은 책 <사생활의 역사>와 <리커넥트>. 오른쪽 짹은 '은둔'과는 또 다른 문제인 사회적 고립에서 벗어나는 방법을 다루고 있다. 두 책이 독자에게 보내는 메시지는 사뭇 다르다. <리커넥트>를 읽고 있노라면, 마치 나는 세상을 잘못 산 것 같은 착각에 빠진다.

정보화 사회가 AI 기술을 만나면서 데이터의 중요성이 더욱 부각되고 있다. 소셜 미디어가 워낙 대중화되어서 더 이상 사생활은 없고, 누구나 경제적 가치와 교환할 수 있다면 자기의 데이터를 넘길 자세가 되어 있는데 우리나라에서는 유난히 규제가 심하다는 논조의 글을 나 역시 종종 써 왔다. 그러나 국가 권력이 여기에 얼마나 개입을 해야 할까? 안보라는 명목으로 개인을 감시해도 될까? 이런 고민을 하다가 데이비드 빈센트의 <사생활의 역사>(원제: PRIVACY: A Short History)를 읽었다. 가장 중요하다고 할 수 있는 맨 마지막 장인 '조지 오웰, 스노든, 다음은?'에서 인용한 몇 편의 참고문헌을 찾아서 한글 번역을 시도하였다. 당연히 작업 도구는 ChatGPT이다. 회색으로 표시한 글은 공백을 포함하여 약 310자 이내로 작성한 요지이다.

William L. Prosser. Privacy. California Law Review 48(3):383, 1960.

사생활 침해를 법적으로 보호해야 한다는 논의가 법적 체계 내에서 어떻게 발전해왔는지를 분석합니다. Prosser는 네 가지 유형(사생활 침입, 공개된 사실, 허위조명, 사적 이익의 무단 이용)으로 사생활 침해를 분류하고, 이를 토대로 명확한 법적 보호 체계를 정립하려 시도합니다.

A. Michael Froomkin. The Death of Privacy? Stanford Law Review 52:1461, 2000.

정보기술과 감시기술의 발전으로 인해 개인 정보 보호가 점점 불가능해지고 있음을 경고합니다. 일상적 감시, 생체인식, 온라인 추적 등 기술이 사생활을 침식하고 있으며, 기존의 법률과 제도는 이를 따라가지 못합니다. 다만 다양한 기술적·법적 조치를 통해 완전한 붕괴는 막을 수 있다고 제안합니다.

Jacob Morgan. Privacy is Complely And Utterly Dead. And We Killed It. Forbes 2014년 8월 19일.

현대 사회에서 개인이 자발적으로 데이터를 공유하며 프라이버시의 종말을 초래했다는 논지를 전개합니다. 감시의 주체는 정부뿐 아니라 개인 자신이며, '죽은 프라이버시'는 단순히 피해자의 문제가 아닌 사회적 선택의 결과임을 강조합니다.

이 분야에서는 매우 유명한 논문(마지막 것은 논문은 아님)인 것 같다. 독후감과 더불어 이 자료를 음미한 바에 대한 글은 나중에 생각을 더욱 정리한 다음 별로로 작성해 보겠다.

ChatGPT에 PDF 파일을 각각 밀어 넣은 뒤 한글 번역본을 역시 PDF로 제공하라고 하였더니, 어떤 문서에 대해서는 그런대로 잘 만들어 내다가 또 어떤 문서는 한글이 아예 표시되지를 않았다. 왜 그런지를 물었더니 다음의 조건을 만족하는 글꼴을 직접 밀어 넣어야 된다는 것이다.

  • TrueType Font(.ttf) 형식
  • 유니코드 범위가 완전하고
  • 단순한 글꼴 구조(복잡한 OpenType 기능이나 CID 맵핑 없음... 무슨 소리인지?)
  • 라이선스가 자유롭고 경량화된 들꼴

ChatGPT에서 한글을 포함하는 PDF 문서를 만들려면 FPDF(단순 문서, 요약 등 간단하고 빠른 작업)이나 ReportLab(논문, 서식지, 다단 문서, 표 포함 문서 등)이라는 것을 써야 하는데, 그 성능에는 조금씩 차이가 있다. 둘 다 파이썬에서 PDF를 생성해 주는 것으로, 앞의 것이 매우 가볍고 빠른 경량 라이브러리이고(원래 PHP용으로 개발) 뒤의 것은 전문적인 PDF 문서를 생성하는 강력한 엔진이라고 한다. 안타깝게도 윈도우 기본 한글 글꼴로는 문제를 일으키는 경우가 많다고 한다. 따라서 다른 무료 글꼴을 사용하는 것을 권장한다. 



권장 글꼴 조합은 다음과 같다. 


예전에 워드 클라우드를 만들 때에는 파이썬 라이브러리를 직접 업로드해야 했는데, 이번 PDF 문서 생성 작업에서는 그걸 요구하지는 않는다. 반면에 글꼴은 넣으라고 한다. ChatGPT가 모든 것을 다 알아서 해결해 주면 좋겠지만 라이선스 문제가 있으니 사용자가 중간 과정을 처리해 줘야 하는 것 같다.

다음은 나눔고딕(Regular/Bold)를 적용하여 ReportLab으로 만든 문서의 스크린샷이다. 처음 시도했던 결과물에서는 줄바꿈이 되지 않고 줄 간격이 16pt로 다소 좁아서 이를 개선해 달라고 하였다. 줄 간격은 24pt로 늘렸고, 문단 사이 간격도 더욱 늘려서 가독성을 좋게 하였다.



ChatGPT에 작업을 요구할 때에는 아주 구체적으로 해야 한다는 것을 다시금 깨달았다.

2025년 6월 1일 일요일

[KORG X2] 드럼킷과 관련한 궁금증

KORG X2/X3에는 총 4개의 편집 가능한 드럼킷(Drum Kit)이 존재한다. A09(Total Kit), A69(ProducrKit), B09(Rave Kit), 그리고 B69(VeloGated)이다. GM 뱅크의 129번-136번에 해당하는 8개의 킷은 편집을 할 수 없다.

X2/X3 Basic Guide 48쪽에는 다음과 같이 4개 킷의 음색 배열이 수록되어 있다.


각 킷에서는 60개의 키 인덱스에 000(Fat Kick)부터 163(Metronome2)까지 총 164개의 드럼 사운드를 매핑해 놓았다. 그런데 나의 X2를 X2P internal preload data로 재설정해 놓은 뒤 실제로 드럼 소리를 들어 보니 여기에서 소개한 배열과 다르다는 것을 발견하였다. X3보다 나중에 출시된 X2에서 분명히 변화를 준 것은 맞는데, 어떤 점이 더 강화되었는지는 문서 등으로 공개되지 않았다. 

Reference manual 170쪽에 의하면 드럼킷 설정은 Global 7A(Drum Kit Setup1)과 7B(Drum Kit Setup2)에서 다루게 되어 있다. 하지만 왜 설정 메뉴가 두 개나 있는지 모르겠다. 왜냐하면 7A-1 모드에서 A1, A2, B1 및 B2를 전부 로드할 수 있기 때문이다. 

인터넷에서 구한 X2/X3용 음색 설정 디스크 중에서 여러 악기로 구성된 완전한 곡이 아니라 드럼 패턴만 수록한 것은 XSD-15 Power Disk가 유일하다. 이 디스크 안에서 X3DRUMS 설정을 로드한 뒤, X3DRUMS.SNG를 시퀀서로 로드하면 S0-S9의 10개 곡 데이터를 얻게 된다. 플로피 디스크 드라이브는 망가졌으므로 .PCG 및 .SNG("X3DRUMS.SNG") 파일을 SysEx로 전환한 뒤 MIDI 케이블을 통해 전송하는 방법을 택해야 한다. 이렇게 설정을 바꾼 상태에서 9개의 곡을 차례로 재생하여 녹음해 보았다.


그러면 이 시퀀스 데이터는 XFD-02 Internal Preload Data 디스크의 X3P_LOAD 설정과 잘 맞는가? 이것으로 설정을 되돌린 뒤, X3DRUMS.SNG를 다시 전송하여 각 곡을 재생해 보면 S1-S5는 소리가 맞지 않는다. 이 시퀀스를 제작한 사람은 X3의 기본 드럼 소리가 마음에 들지 않았던 모양이다. 

KORG X2가 드럼 머신으로서 탁월한 장비는 아니다. 만약 내가 '손가락 드럼'에 진정 관심이 있다면, 이미 보유하고 있는 AKAI MPK mini를 공부하는 것이 투입한 노력 대비 성과의 측면에서는 더 나을지도 모른다. 그러나 비록 구식 장비이기는 하나 음원으로부터 내장 시퀀서까지 모든 것을 다 갖춘 Music Workstation도 그 나름대로의 매력이 있다.

시퀀스 데이터에서 드럼 패턴을 복사에서 재사용 가능하게 만들어 보고 싶다.