2025년 6월 12일 목요일

ChatGPT를 보다 능률적으로 쓰는 방법 - 중간 단계마다 저장한 파일을 활용하기

ChatGPT에서 하나의 주제로 대화창을 만들어서 몇 달에 걸쳐서 이야기를 풀어 나가는 방법은 시간이 지날수록 효율이 떨어진다. 문답을 주고받으며 발전해 나가는 전체 대화를 기억해 주는 것은 매우 고마운 일이지만, 기억할 정보의 분량이 많아지면서 점점 많은 시간이 소요되기 때문이다. 하루에도 몇 개의 새로운 대화를 만들어 내기 때문에, 과거의 대화에서 내가 원하는 정보를 다시 찾아내는 일도 매우 번거롭다.

그래서 효율화를 위해 하나의 꼼수를 생각해 냈다. 예를 들어 아두이노 나노를 이용한 MIDI 컨트롤러를 설계하는 대화는 너무 길어져서 새로운 기능을 제안하여 구현 가능성을 평가하고 회로와 코드를 설계하는 데에도 많은 시간이 걸린다. 이에 따라서 지금까지의 결론을 종합하여 문서로 정리하여 보관한 뒤, 다음번 세션에서는 이 파일을 새 창에 로드한 뒤 추가적인 변경 사항을 적용해 나가는 것이다.

어설픈 개념을 실증하는 물건 하나를 만드는 단순한 일이지만 실제로 해 보니 핀 배치나 코드 작성보다 메뉴 및 작동법을 설계하는 것이 더 어렵다. 몇 개 되지 않는 버튼과 인코더를 이용하여 능률적이면서도 직관적인 조작 인터페이스를 만들어야 한다. 그러니 진짜 양산용 신시사이저를 만들 때에는 얼마나 많은 실행 착오가 있었겠는가? 실제 DIY 과정에서는 케이스 가공이 또 발목을 잡을 것이다. CAD 가공을 하기 어려운 재활용품 수준의 알루미늄 섀시에 LCD를 위한 네모진 구멍을 어떻게 뚫는단 말인가? 어쨌든 ChatGPT 덕분에 직접 프로토타입을 만들어 단계별로 실증해 나가면서 진행하지 않고 오로지 컴퓨터와 대화하면서 시행착오를 줄여 나가고 있으니 그것만으로도 참 고마운 일이다. 브레드보드에 부품을 올려서 작동해 보면 미처 생각하지 못했던 문제점이 또 발견될 것이다.

중간 과정마다 파일로 저장하여 다시 로드하는 방법이 모든 종류의 대화에 어울리지는 않을 것이며, 단점도 갖고 있다. 각 단계에서 저장된 파일을 잘 관리해야 하고, 중간에 바뀐 것을 나중에 음미하고자 할 때 원본 자료를 찾기가 약간 난해하다. 즉, 매번 파일로 저장한 것이 최선이고 다시 과거로 돌아갈 일이 없다고 가정한다면 가장 좋은 방법이 될 수 있다. 

이런 용도의 중간 저장본은 PDF보다는 Word 파일이 더 낫다. 파일을 다운로드하여 나름대로 생각한 수정사항을 반영하여 편집한 뒤, 다시 업로드하여 후속 작업을 할 수 있기 때문이다. PDF는 수정할 일이 없는 최후 버전을 미려하게 만들 때 유용하다. 단, 글꼴을 별도로 업로드하고 포맷도 상세하게 지정해 줘야 실수를 하지 않는다. 오죽하면 한글 PDF 출력용 텍스트 생성 가이드 템플릿을 별도로 만들었겠는가(관련 글 링크). 글꼴은 나눔고딕(NanumGothic.ttf, NanumGothicBold.ttf)을 추천한다. ChatGPT는 용지 밖으로 글이 길게 튀어나가도록 자꾸 실수를 하기 때문에 제발 이러지 말라고 명시적으로 지시해 줘야 한다.

이 텍스트를 A4 크기의 한글 PDF로 출력 가능한 형태로 정리해 줘.

- 줄바꿈이 잘 되도록 문단을 정돈해 줘.
- 여백은 좌우 20mm, 위아래 20mm로 맞춰 줘.
- 줄간격은 약 1.4배로 해 줘.
- 본문 글꼴은 '나눔고딕(NanumGothic)'을, 제목에는 '나눔고딕 Bold'를 사용해 줘.
- 글꼴 파일은 내가 업로드할 테니 그걸 적용해 줘.
- 용지 밖으로 문장이 튀어나가지 않게 해 줘.
- 단락마다 적당한 줄 간격(공백)도 넣어 줘.

최종적으로는 PDF 파일로 만들어 줘.

어떤 주제에 대해서 보고서를 자동 생성하게 하면 검증이 필요함을 몇 번의 경험을 통해 알게 되었다. 예를 들어 존재하지도 않는 「바이오경제의 육성 및 지원에 관한 법률」(바이오혁신법)이 2024년부터 시행된다고 하는 것 말이다. 농림축산식품부에서 만든 「그린바이오산업 육성에 관한 법률」이라는 것은 그 존재를 확인하였다. 모든 분야를 통틀어서 '바이오산업'이란 용어가 들어간 법령은 이게 유일한 것 같다. 상당히 발빠른 행보가 아닐 수 없다. 

ChatGPT가 만든 결과물을 전부 믿을 수는 없지만, 문서 파일을 입수하여 업로드한 뒤 그 범위 안에서만 번역·요약하고 시사점을 도출하게 지시하면 꽤나 만족스런 결과물이 나온다. 이건 인간 지능의 몫인데... 시간은 부족하고 검토할 자료는 많으니 기계의 힘을 빌릴 수밖에. 씁쓸하다.

2025년 6월 11일 수요일

'K-휴지'는 물에 녹지 않는다?

'선풍기를 켠 채로 자면 죽는다'는 속설이 한국에서만 유행했던 적이 있다. 이런 미신을 비꼬는 듯한 영문 웹사이트 'FanDeath'라는 것이 있었다. 그 웹사이트를 방문하였던 기억은 지금도 선명하다. 최상위 도메인이 com인지 org인지는 모르겠다. 

특히 그 사망의 원인으로서 '질식'이 늘 꼽혔는데, 선풍기 바람에 호흡 장애가 일어나거나 질식한다는 것은 상식적으로도 이해가 되지 않는다. 나는 선풍기의 작동 소음이 싫고, 특히 잠을 잘 때에는 몸에 차갑게 바람이 닿는 것을 싫어한다. 그래서 타이머가 꺼지고 나서야 비로소 잠이 들 때가 많다.

어제 세종시에 있는 어떤 회의장에 갔다가 화장실에서 재미있는 안내문을 보았다. 본 화장실에 비치된 휴지는 물에 풀어지지 않기 때문에 변기에 넣지 말고 반드시 옆에 놓인 휴지통에 넣으라는 것이다.

국내에서 팔리는 화장실용 휴지는 국가기술표준원에서 정한 규격과 KS 인증을 통과해야만 한다. 그런데 그 화장실은 그 규격을 통과하지 못하는 훨씬 질긴 것을 구입하여 비치한단 말인가? 왜? 사용 중에 찢어질 것을 우려하여? 잘 이해가 가지 않는다.주변에서 흔히 보는 두루마리 하나를 그대로 변기에 넣지 않는 이상 상식적인 사용량 수준에서는 막히는 일이 벌어지지 않는다.  대나무 펄프로 만든 휴지는 질긴 편이라고 하는데, 그렇다고 하여 변기를 막을 수준은 아닐 것이다. 

물론 세상은 상식적인 사람만으로 채워지지는 않는다. 미국 여행 중 패스트푸드점의 소변기에서 볼일을 보고 허리 높이의 레버를 발로 차듯이 밀어서 물을 내리는 사람을 본 일이 있었으니까 말이다. 심지어 좌변기의 레버를 손으로 누르냐 발로 누르냐에 대한 논쟁이 벌어진 일도 있었다.

"공중 화장실 변기 레버는 바닥에 설치돼있지 않는 이상 손으로 누르는 것이 맞다"(링크)

페이셜 티슈('크리넥스')나 냅킨 종류는 질긴 편이라서 화장실에서 쓰기에는 적합하지 않으니 예외로 하자.

공중 장소의 화장실에서 흔히 보는 또 다른 안내문 중에는 이런 것이 있다. 수압이 약하여 자주 막히니 사용한 휴지는 별도의 휴지통에 넣어 달라는 것. 표준 양변기의 물탱크 용량은 6~10리터라고 한다. 채워진 물의 부피를 줄이기 위해 일부러 벽돌을 몇 장 넣지 않고서는 수압이 약할 수가 없다. 결국 화장실용 휴지를 변기에 넣으면 막힌다는 것은 선풍기를 켜고 자면 죽는다는 'K-미신'과 다를 바가 없다.

변기가 막히는 가장 큰 원인은 변기에 넣어서는 안 되는 물건을 넣기 때문이다. 대표적인 것이 물티슈이다. 용케 변기를 막지 않고 흘러 나간다 하더라도 하수처리장까지 가서 모이면 문제를 일으킨다. 

사용한 화장실용 휴지가 갈 곳은 변기밖에 없다. '변기에 넣지 말고 제발 휴지통에 넣어 주세요'라는 경고물을 제발 더 이상 보지 않았으면 좋겠다.

2025년 6월 10일 화요일

수운교 도솔천(水雲敎兜率天)에 가다

수운교란 1923년 세워진 동학 계열의 신종교이다. '수운'이란 동학을 창시한 최제우(1824~1864)의 호이다. 동학에서 발전하여 생겨난 천도교와 수운교는 같지 않다. 다들 아다시피 동학이란 서학(천주교)에 대항하여 생긴 종교이다. 수운교에 대한 정보는 공식 웹사이트 또는 한국민족문화대백과사전을 참고하라. 이 계열의 종교에서 최제우는 '하늘님'을 대신하는 천사(혹은 예수나 무함마드?)와 같은 존재인 것 같다. 그리고 하늘님을 일컫는 말은 정말 여러 종류가 있다.

하늘님/하느님/하날님/하나님/한을님/한우님/한울님 - 작성자: 탁암 

대전 유성구의 자운대라는 동네는 1990년대부터 군사 학교와 시설이 모인 곳이다. 흔히들 신성동이라는 행정동 이름으로 한꺼번에 부르지만, 자운대가 자리잡고 있는 곳은 법정동인 자운동과 추목동 등지이다. 자운대 지역으로 들어갈 때 거쳐가야 했던 검문소는 이제 없어졌다. 이곳을 찾은 일요일 오전, 군사 학교 등이 좌우로 펼쳐진 너른 길에서 달리기를 하는 사람 두어 명을 보았다. 사거리에서 2km 넘게 직진하여 들어간 뒤 좌회전하여 공동주택단지 사이로 접어들면 수운교 도솔천으로 가는 입구가 나타난다.

도솔천을 마지막으로 찾았던 것이 아마 십오륙년 전일 것이다. 숲길을 들어서니 평온하고 시원한 공기가 우리를 감싼다.

도솔천이란 불교의 천계 중 욕계에 속하는 네 번째 하늘이며, 미륵보살이 머무는 것이다.

수운교 도솔천은 1929년에 지어진 건물로서 대전광역시 유형문화유산이다. 절로 치자면 대웅보전과 같은 곳이다. 지붕 위에 잡상을 올린 것은 마치 조선시대 궁궐을 보는 것만 같다. 수운교의 창시자 이상룡이 설계하고, 조선 말기 경복궁을 중건한 최원식이 지었다고 한다.



바닥에 돌을 박아 교기(敎旗)인 궁을기(弓乙旗)를 새겼다. 수운교 공식 웹사이트에 의하면 "궁은 선(仙)이요, 을은 불(佛)이니 선불합덕이다. 하늘과 땅이 열리고 닫히는 조화의 문이며, 음양이 출입하는 길이요, 만물이 생성하는 기틀이다."라고 하였다. 중앙에 점을 찍으면 천도교의 궁을기와 같은 모양이 된다.



도솔천은 하늘님을 모신 천단이다. 마침 옆문이 열려 있어서 여기까지 접근할 수 있었다.

돌로 두드리면 쇠소리가 난다는 석종. 도솔천 서쪽에 있다.

수운교의 세계관을 그린 삼천대천세계도는 올해 국가등록문화유산이 되었다(기사 링크).

도시락을 싸 들고 가서 울창한 나무 그늘 사이에서 한가롭게 거닐고 싶은 곳이다. 비록 동학의 기본 정신을 받아들이지는 않더라도. 실은 요즈음 이중표의 <윤회와 해탈>을 읽고 있는 중이다. 나 자신은 현재 종교를 갖고 있지 않은 상태가 되었지만, 어떤 종교든지 그 탄생 배경을 이해하고 약간은 깊이 있게 공부하고 싶은 욕심이 있다. 



2025년 6월 6일 금요일

KORG X2의 2025년도 수리를 마무리하였다 - 헤드폰 앰프용 op amp 및 12V 전원 보드 교체

헤드폰 앰프 칩(M5261L)을 교체하고, +/-12V 전원 공급 보드를 약간 더 고급 제품으로 교체하는 것으로 올해의 수리를 마무리하기로 하였다. Hiss-like 잡음을 완벽하게 잡는 데에는 실패했지만, 볼륨을 최대로 했을 때 헤드폰에서만 들리는 잡음에 너무 집착하지는 않는 것이 나으리라. 이것 말고도 올해 마무리해야 할 MIDI/audio 관련 DIY는 몇 가지가 더 있다.

팝업 노이즈는 +5V와 +/-12V 전원 공급 보드를 서로 다른 것을 사용하면서 조화를 이루지 못하는 데에 기인하는 것으로 여기고, 파워 스위치를 작동시킬 때 볼륨 슬라이더를 최대로 내리는 것으로 대충 모면하기로 했다. 5V가 공급되고 나서 커넥터를 끼워 넣으면서 12V가 들어오도록 해 봤는데(0.x초였을 것이라고 자신함) 여전히 팝업 노이즈가 발생했기 때문이다. 따라서 지연 릴레이 모듈은 일단 부품통 속으로 들어갔다.

12V 전원 공급 보드를 바꾸기 전에 메인보드에서 DAC 및 IVC에 공급되는 5V를 오실로스코프로 아래 그림의 빨간 지점에서 측정해 보았을 때 아주 깨끗하였다. 따라서 LT3042 초저잡음 LDO를 이용한 레귤레이터 보드도 부품통 속으로 보냈다.



이대로 마무리하기가 아쉬워서 M5261L op amp를 교체하였다. 혹시 가짜 칩이 아닐까 걱정을 했는데 소리가 잘 난다. 하지만 hiss 잡음은 별다른 변화가 없다.

M5216L('a high-output and high speed operational amplifier for use in high-performance headphone amplifiers and mizer amplifiers found in cassette decks'). 위의 것이 아날로그 보드에 원래 꽂혀 있던 것이다.

새 칩이 자리를 잡은 후.


다음으로 LM317/LM337을 사용한 +/-12V 전원 보드를 장착하였다. 기존의 것을 들어내고 나니 자리가 부족하여 옆의 빈 공간을 활용하였다.


아, 이 무슨 난해한 배치인가.


개조를 마친 뒤 Audacity에서 무음 상태로 녹음을 한 뒤 50dB 증폭을 하여 재생해 보았다. '쉬-잇' 말고는 험이 들리지 않는다. 마지막으로 WaveSpectra에서도 측정을 해 보았다. 60Hz/120Hz 근방에 별다른 피크가 보이지 않는다.


앞으로 잡음은 잠시 잊어 버리고 '음악 공부'를 더 하는 것이 나을 것이다. 혹시 모르니 내년쯤 아날로그 보드의 모든 전해 커패시터를 교체해 보리라.

노이즈의 특성을 이해하지 못한 해프닝이었을까? 3월부터 끌어온 이 프로젝트가 나에게 무엇을 남겼는지 곰곰이 생각해 보았다. 전동 드라이버와 오실로스코프 등 DIYer에게 필수라고 할 수 있는 공구와 계측기를 갖게 되었고, PCB에서 부품을 떼는 요령도 많이 늘었다. SMD 부품을 떼고 붙이는 데까지 함부로 흥미를 갖지 않게 된 것은 다행스러운 일이다.

Tactile switch는 어차피 고쳐야 할 것이었고, 결과적으로 강압 트랜스포머 없이 220V에 직결하여 쓸 수 있게 개조한 것도 의미 있는 일이었다. 2025년이라는 시대에 '빈티지 신스'인 X2를 이용하여 라이브 연주나 녹음을 하겠다는 의지가 생겼다는 점이 무엇보다 중요하다.

 

부품통의 새 전해 커패시터도 제조일자를 확인해 가면서 써야 하는가? ESR까지 측정해 가면서?

며칠 전, 알리익스프레스에서 5,785원에 구입한 키트형 XR2206 1Hz-1MHz 함수 발생기(function generaor)를 조립한 뒤 30,250원짜리 오실로스코프에 연결하여 테스트를 하다가 깜짝 놀랐다. 0볼트를 중심으로 움직이는 교류 신호(정현파, 삼각파, 사각파)가 아니라 DC 오프셋이 존재하는 형태인 '맥류'였던 것이다. 공급 전압이 9~12VDC이므로 대략 그 중간 어딘가를 기준으로 변동하는 출력이 나오는 것은 대단히 자연스럽다. 하지만 이 상태로는 자작 오디오 앰프의 성능을 시험하는 신호원으로 쓰기가 나쁘다.


조립 후 뚜껑을 덮기 전.


회로도. XR2206 monolithic function generator의 데이터시트는 여기를 참조할 것.


instructable.com의 7$ Functiona Generator Kit With XR2206 Problems: Don't Buy Before Watching이라는 글에서도 'There's always around 5.56V DC offset in the output'이라고 하였다. 조립 과정 및 테스트에 대한 아주 상세한 글은 여기(XR2206 Function Generator Assembly and Operations manual)에 있다.

물론 대부분의 앰프 입력단에는 DC를 차단하기 위한 커플링 커패시터(coupling capacitor)가 들어 있어서 실용적으로 문제는 없을 것이다. 그러나 판매자는 이러한 사실을 정확하게 알려 주어야 하지 않았겠는가? 국내에서도 이 키트를 소개하면서 제작 및 테스트 과정을 보여주는 유튜버가 있었는데 DC offset에 대해서는 아무 언급이 없었다.

갖고 있는 몇 종류의 커패시터를 함수 발생기 출력 단자에 직렬로 연결해 보면서 AC 신호를 잘 뽑아내는 데 어느 것이 가장 좋은지 점검해 보았다. 1uF 미만의 필름 캐패시터는 그 역할을 아주 잘 수행하였다. 그런데 전해 커패시터는 그렇지 않았다. 4.7uF의 무극성 전해 캐패시터 및 10/22uF의 일반 전해 커패시터를 연결해 보았지만 DC 오프셋이 거의 제거되지 않았다. 도대체 왜 그런가? ChatGPT와 대화를 해 보니 '오래 되어서 성능이 떨어져서 그럴 수 있다'는 것이다.

104(0.1uF) 필름 커패시터로 테스트하는 중. 바닥에 놓인 0.22uF 'X2' 커패시터도 디커플링을 잘 수행하였다. XY 커패시터는 EMC 필터에 쓰이는 특수 커패시터이다(설명).


전해 커패시터에도 유통기한이 있나? 그렇다고 한다. 어떤 글에서는 '직사광선을 피해 개봉 전 6개월, 개봉 후 한 달'이라고 하였다. 미사용 상태의 '새' 전해 커패시터가 슬슬 성능이 떨어진다는 것은 매우 충격적이었다. 아니, 무슨 식품도 아니고... 그러면 7~8년 전에 한꺼번에 구입해 놓은 전해 커패시터는 어쩌라고? 부풀거나 전해액이 흘러서 외관상 확연히 구별되는 (특히 전원부 평활회로의) 전해 커패시터가 아니라면 전면 교체, 즉 '리캡'이 필요하지 않다는 글과, 새 전해 캐패시터라 하더라도 몇 달 안에 써야 한다는 글 사이에서 무엇을 따라야 하는지 고민스럽다.

심지어 보유하고 있는 새 캐패시터의 성능을 사용 전에 점검하기 위해 ESR(Equivalant Series Resistance) 측정기를 장만해야 하는가? '커패시터 누설 저항과 ESR은 일반적인 멀티미터로 측정하기 어려운 고장 지표'라는 것이 1966년에 텍사스 대학교 오스틴 캠퍼스 전기공학과에서 학사를 취득한 William Mays의 의견이다(Quora 링크). 정말 놀랍게도 이것 역시 몇 천원에 구입할 수 있다. 맹그러(Maker)님이 ESR에 관해 쓴 좋은 글(링크)이 있어서 소개한다.

어쩌면 이번의 작은 발견은 자작한 기기를 오랫동안 보수하면서 사용하겠다는 DIYer의 기본 철학에 대한 심각한 도전이 될 것만 같다. 차라리 적당한 주기로 새 물건을 사거나 새로 만드는 것이 더 나을지도 모른다. 전해 커패시터의 수명이 다하기 전에.

2025년 6월 4일 수요일

거버넌스(governance)의 의미를 정확히 알고 쓰기, 그리고 데이터 거버넌스 이야기

'거버넌스'라는 영단어의 뜻을 찾아 보았더니 '협치'라는 풀이가 튀어나와서 적잖이 놀랐던 적이 있었다. 'govern'이 '통치하다, 지배하다' 정도의 뜻을 갖고 있으므로 당연히 이와 유사한 뜻의 명사형이 나올 것이라고 생각했기 때문이다. 'goven'에서 유래한 명사는 'governance'뿐만이 아니라 'government'(정부)도 있다. 미리암-웹스터 사전에서는 governance를 다음과 같이 정의하였다.

governance the act or process of governing or overseeing the control and direction of something (such as a country or an organization)

어떤 조직의 '지배구조'라고 해야 할 곳에 그저 '거버넌스'라는 낱말을 넣어서 멋있게 보이는 글을 만드는 사람도 있는 것 같다. 도대체 '거버넌스'가 무엇인가? 공법학연구 제22권 제2호에 실린 양천수의 2021년 논문 데이터법-형성과 발전 그리고 과제-를 읽다가 225쪽에서 이와 관련한 글이 있어서 원문의 일부를 그대로 인용해 본다. 굵은 글씨와 밑줄은 내가 추가한 것이다.

데이터법은 최근 데이터에 관해 논의의 초점이 되는 데이터 거버넌스(data governance)를 구현하는 중요한 구성요소가 된다. 여기서 데이터 거버넌스는 간략하게 말하면 데이터를 관리 또는 규율하는 체계로 이해할 수 있다. 다만 데이터 거버넌스를 구체적으로 어떻게 파악할 것인지는 이에 전제가 되는 ‘거버넌스’(governance)를 어떻게 이해할 것인지와 밀접한 관련을 맺는다. 거버넌스는 보통 정부를 뜻하는 ‘거번먼트’(government)에 대립하는 개념으로 제시되었다. 폐쇄적인 관료제로 구성되는 거번먼트와는 달리 거버넌스는 외부와 네트워크로 연결되는 열린 조직을 추구한다. 그 때문에 상명하달 형식의 수직적인 소통이 주류를 이루는 거번먼트와는 달리 거버넌스에서는 상호이해와 참여, 협력을 기반으로 하는 수평적 소통이 중심이 된다. 요컨대 전통적인 거번먼트가 팽팽하고 경직된 조직과 수직적 소통에 바탕을 둔다면 거버넌스는 느슨하고 탄력적인 조직과 수평적 소통에 바탕을 둔다.

거버넌스를 지배구조라는 용어와 동일시하게 된 것은 corporate governance(기업 지배구조)라는 용어의 영향인 것으로 보인다. 여기에서의 지배구조는 기업을 운영하고 의사를 결정하기 위한 주주/이사회 중심의 통제 구조를 뜻한다. 반면 거버넌스는 어떠한 조직 외부의 이해관계자 참여까지 포함하는 열린 개념이다. 그러니 이를 '협치'라고 뜻풀이를 해 놓은 것은 최선은 아니더라도 차선은 되는 셈이다. 그렇다 해도 '데이터 협치'라고 해 놓으면 너무 어색하다. 어쩔 수 없이 영단어를 소리나는 그대로 한글로 옮겨서 적지만, 이렇게 함으로써 한글의 발전과 확장 가능성을 스스로 차단하는 것 같아 씁쓸하다.

ChatGPT에 따르면 지배구조는 governance as control이고, 거버넌스는 governance as process이다. 다시 설명하자면 오늘날 거버넌스의 올바른 의미는 어떤 조직, 시스템, 네트워크가 의사결정하고, 책임을 지며, 자원을 배분하고, 규범을 따르는 방식 전체를 말한다.

2014년 포브스에 실렸던 Jacob Morgan의 글 'Privacy is completely and utterly dead, and we killed it'을 음미하다가 이번에는 Personal Genome Project(PGP)로 대표되는 '정보를 공유할 권리(right ti share)'에 매료되어 본다. 아, 지조가 있어야 하는데 이렇게 '스윙'까지 해서야 되겠는가... 이번 제21대 대통령 선거에서도 언론 매체를 통해 '스윙(보터)'이라는 표현을 많이 보게 되었다. 우리말을 가다듬고 쓰임새를 늘림과 동시에 새로운 낱말을 갈고 다듬으면 안 되나?

2025년 6월 2일 월요일

ChatGPT에서 PDF를 만들기에 적합한 한글 TTF 글꼴은?

최근 읽은 책 <사생활의 역사>와 <리커넥트>. 오른쪽 책은 '은둔'과는 또 다른 문제인 사회적 고립에서 벗어나는 방법을 다루고 있다. 두 책이 독자에게 보내는 메시지는 사뭇 다르다. <리커넥트>를 읽고 있노라면, 마치 나는 세상을 잘못 산 것 같은 착각에 빠진다.

정보화 사회가 AI 기술을 만나면서 데이터의 중요성이 더욱 부각되고 있다. 소셜 미디어가 워낙 대중화되어서 더 이상 사생활은 없고, 누구나 경제적 가치와 교환할 수 있다면 자기의 데이터를 넘길 자세가 되어 있는데 우리나라에서는 유난히 규제가 심하다는 논조의 글을 나 역시 종종 써 왔다. 그러나 국가 권력이 여기에 얼마나 개입을 해야 할까? 안보라는 명목으로 개인을 감시해도 될까? 이런 고민을 하다가 데이비드 빈센트의 <사생활의 역사>(원제: PRIVACY: A Short History)를 읽었다. 가장 중요하다고 할 수 있는 맨 마지막 장인 '조지 오웰, 스노든, 다음은?'에서 인용한 몇 편의 참고문헌을 찾아서 한글 번역을 시도하였다. 당연히 작업 도구는 ChatGPT이다. 회색으로 표시한 글은 공백을 포함하여 약 310자 이내로 작성한 요지이다.

William L. Prosser. Privacy. California Law Review 48(3):383, 1960.

사생활 침해를 법적으로 보호해야 한다는 논의가 법적 체계 내에서 어떻게 발전해왔는지를 분석합니다. Prosser는 네 가지 유형(사생활 침입, 공개된 사실, 허위조명, 사적 이익의 무단 이용)으로 사생활 침해를 분류하고, 이를 토대로 명확한 법적 보호 체계를 정립하려 시도합니다.

A. Michael Froomkin. The Death of Privacy? Stanford Law Review 52:1461, 2000.

정보기술과 감시기술의 발전으로 인해 개인 정보 보호가 점점 불가능해지고 있음을 경고합니다. 일상적 감시, 생체인식, 온라인 추적 등 기술이 사생활을 침식하고 있으며, 기존의 법률과 제도는 이를 따라가지 못합니다. 다만 다양한 기술적·법적 조치를 통해 완전한 붕괴는 막을 수 있다고 제안합니다.

Jacob Morgan. Privacy is Complely And Utterly Dead. And We Killed It. Forbes 2014년 8월 19일.

현대 사회에서 개인이 자발적으로 데이터를 공유하며 프라이버시의 종말을 초래했다는 논지를 전개합니다. 감시의 주체는 정부뿐 아니라 개인 자신이며, '죽은 프라이버시'는 단순히 피해자의 문제가 아닌 사회적 선택의 결과임을 강조합니다.

이 분야에서는 매우 유명한 논문(마지막 것은 논문은 아님)인 것 같다. 독후감과 더불어 이 자료를 음미한 바에 대한 글은 나중에 생각을 더욱 정리한 다음 별로로 작성해 보겠다.

ChatGPT에 PDF 파일을 각각 밀어 넣은 뒤 한글 번역본을 역시 PDF로 제공하라고 하였더니, 어떤 문서에 대해서는 그런대로 잘 만들어 내다가 또 어떤 문서는 한글이 아예 표시되지를 않았다. 왜 그런지를 물었더니 다음의 조건을 만족하는 글꼴을 직접 밀어 넣어야 된다는 것이다.

  • TrueType Font(.ttf) 형식
  • 유니코드 범위가 완전하고
  • 단순한 글꼴 구조(복잡한 OpenType 기능이나 CID 맵핑 없음... 무슨 소리인지?)
  • 라이선스가 자유롭고 경량화된 들꼴

ChatGPT에서 한글을 포함하는 PDF 문서를 만들려면 FPDF(단순 문서, 요약 등 간단하고 빠른 작업)이나 ReportLab(논문, 서식지, 다단 문서, 표 포함 문서 등)이라는 것을 써야 하는데, 그 성능에는 조금씩 차이가 있다. 둘 다 파이썬에서 PDF를 생성해 주는 것으로, 앞의 것이 매우 가볍고 빠른 경량 라이브러리이고(원래 PHP용으로 개발) 뒤의 것은 전문적인 PDF 문서를 생성하는 강력한 엔진이라고 한다. 안타깝게도 윈도우 기본 한글 글꼴로는 문제를 일으키는 경우가 많다고 한다. 따라서 다른 무료 글꼴을 사용하는 것을 권장한다. 



권장 글꼴 조합은 다음과 같다. 


예전에 워드 클라우드를 만들 때에는 파이썬 라이브러리를 직접 업로드해야 했는데, 이번 PDF 문서 생성 작업에서는 그걸 요구하지는 않는다. 반면에 글꼴은 넣으라고 한다. ChatGPT가 모든 것을 다 알아서 해결해 주면 좋겠지만 라이선스 문제가 있으니 사용자가 중간 과정을 처리해 줘야 하는 것 같다.

다음은 나눔고딕(Regular/Bold)를 적용하여 ReportLab으로 만든 문서의 스크린샷이다. 처음 시도했던 결과물에서는 줄바꿈이 되지 않고 줄 간격이 16pt로 다소 좁아서 이를 개선해 달라고 하였다. 줄 간격은 24pt로 늘렸고, 문단 사이 간격도 더욱 늘려서 가독성을 좋게 하였다.



ChatGPT에 작업을 요구할 때에는 아주 구체적으로 해야 한다는 것을 다시금 깨달았다.


2025년 6월 12일 업데이트

📄 한글 PDF 출력용 텍스트 생성 가이드 템플릿

✅ 1. 기본 요청 문구 (복사하여 그대로 사용 가능)

이 텍스트를 A4 크기의 한글 PDF로 출력 가능한 형태로 정리해 줘.
- 줄바꿈이 잘 되도록 문단을 정돈해 줘. - 여백은 좌우 20mm, 위아래 20mm로 맞춰 줘. - 줄간격은 약 1.4배로 해 줘. - 본문 글꼴은 '나눔고딕(NanumGothic)'을 사용하고, 제목에는 '나눔고딕 Bold'를 사용해 줘. - 글꼴 파일은 내가 업로드할 테니 그걸 적용해 줘. - 용지 밖으로 문장이 튀어나가지 않게 해 줘. - 단락마다 적당한 줄 간격(공백)도 넣어 줘. 최종적으로는 PDF 파일로 만들어 줘.

✅ 2. PDF에 적합한 문서 구성 예시

제목: 디지털 바이오 거버넌스의 미래
부제: 데이터 커먼즈와 WOBD를 중심으로 1. 서론 디지털 생명과학 시대에서 데이터는 개인의 프라이버시와 동시에 공공성을 갖는 중요한 자원이 되었다. 본 문서에서는... 2. 데이터 커먼즈란 무엇인가 Elinor Ostrom의 공유지 원칙에 근거하여, 데이터 커먼즈는... 3. WOBD 사례 분석 미국 NSCEB 보고서에서 제안한 Web of Biological Data는... 4. 정책적 시사점 이러한 구조를 한국에 도입하기 위해서는... 5. 결론 데이터 커먼즈는 무분별한 개방이 아닌, 조건부 신뢰 기반 공유를 뜻한다... (※ 각 섹션은 명확한 제목, 짧은 문단, 한글 줄바꿈 기준에 따라 정리)

✅ 3. 글꼴 사용 안내

  • 기본 본문 글꼴: NanumGothic.ttf

  • 제목/소제목 글꼴: NanumGothicBold.ttf

  • 필요 시 매 세션마다 업로드
    👉 업로드 예시:

    file-NanumGothic.ttf file-NanumGothicBold.ttf

✅ 4. 줄바꿈 잘 되는 문장 스타일 예시

  • 줄바꿈 안 되는 예시 (문장 하나가 너무 김):

    데이터 커먼즈란 단순히 데이터를 개방한다는 의미가 아니라, 공동체가 신뢰와 거버넌스를 바탕으로 지속 가능하게 운영하고 활용하는 구조를 말한다.
  • 줄바꿈 되는 예시 (적절한 길이로 문장 분리):

    데이터 커먼즈는 단순한 개방을 뜻하지 않는다.
    그것은 공동체가 신뢰와 규칙을 기반으로 데이터를 지속 가능하게 관리하는 구조이다.

✅ 5. 스타일 요약

항목설정 값
페이지 크기A4 (210x297mm)
여백좌우 20mm, 위아래 20mm
본문 글꼴나눔고딕 10.5pt
제목 글꼴나눔고딕 Bold 12.5–16pt
줄간격leading = 14 (1.4배 수준)
문단 간격단락 사이 8pt 이상
줄바꿈 처리자동 wrapping or <br/>
인코딩UTF-8 한글 지원 글꼴 필요

이 템플릿을 복사해 두셨다가 PDF 요청 시 활용하면 매번 줄바꿈이나 폰트 문제로 고생할 일이 없게 됩니다.