2025년 6월 2일 월요일

ChatGPT에서 PDF를 만들기에 적합한 한글 TTF 글꼴은?

최근 읽은 책 <사생활의 역사>와 <리커넥트>. 오른쪽 책은 '은둔'과는 또 다른 문제인 사회적 고립에서 벗어나는 방법을 다루고 있다. 두 책이 독자에게 보내는 메시지는 사뭇 다르다. <리커넥트>를 읽고 있노라면, 마치 나는 세상을 잘못 산 것 같은 착각에 빠진다.

정보화 사회가 AI 기술을 만나면서 데이터의 중요성이 더욱 부각되고 있다. 소셜 미디어가 워낙 대중화되어서 더 이상 사생활은 없고, 누구나 경제적 가치와 교환할 수 있다면 자기의 데이터를 넘길 자세가 되어 있는데 우리나라에서는 유난히 규제가 심하다는 논조의 글을 나 역시 종종 써 왔다. 그러나 국가 권력이 여기에 얼마나 개입을 해야 할까? 안보라는 명목으로 개인을 감시해도 될까? 이런 고민을 하다가 데이비드 빈센트의 <사생활의 역사>(원제: PRIVACY: A Short History)를 읽었다. 가장 중요하다고 할 수 있는 맨 마지막 장인 '조지 오웰, 스노든, 다음은?'에서 인용한 몇 편의 참고문헌을 찾아서 한글 번역을 시도하였다. 당연히 작업 도구는 ChatGPT이다. 회색으로 표시한 글은 공백을 포함하여 약 310자 이내로 작성한 요지이다.

William L. Prosser. Privacy. California Law Review 48(3):383, 1960.

사생활 침해를 법적으로 보호해야 한다는 논의가 법적 체계 내에서 어떻게 발전해왔는지를 분석합니다. Prosser는 네 가지 유형(사생활 침입, 공개된 사실, 허위조명, 사적 이익의 무단 이용)으로 사생활 침해를 분류하고, 이를 토대로 명확한 법적 보호 체계를 정립하려 시도합니다.

A. Michael Froomkin. The Death of Privacy? Stanford Law Review 52:1461, 2000.

정보기술과 감시기술의 발전으로 인해 개인 정보 보호가 점점 불가능해지고 있음을 경고합니다. 일상적 감시, 생체인식, 온라인 추적 등 기술이 사생활을 침식하고 있으며, 기존의 법률과 제도는 이를 따라가지 못합니다. 다만 다양한 기술적·법적 조치를 통해 완전한 붕괴는 막을 수 있다고 제안합니다.

Jacob Morgan. Privacy is Complely And Utterly Dead. And We Killed It. Forbes 2014년 8월 19일.

현대 사회에서 개인이 자발적으로 데이터를 공유하며 프라이버시의 종말을 초래했다는 논지를 전개합니다. 감시의 주체는 정부뿐 아니라 개인 자신이며, '죽은 프라이버시'는 단순히 피해자의 문제가 아닌 사회적 선택의 결과임을 강조합니다.

이 분야에서는 매우 유명한 논문(마지막 것은 논문은 아님)인 것 같다. 독후감과 더불어 이 자료를 음미한 바에 대한 글은 나중에 생각을 더욱 정리한 다음 별로로 작성해 보겠다.

ChatGPT에 PDF 파일을 각각 밀어 넣은 뒤 한글 번역본을 역시 PDF로 제공하라고 하였더니, 어떤 문서에 대해서는 그런대로 잘 만들어 내다가 또 어떤 문서는 한글이 아예 표시되지를 않았다. 왜 그런지를 물었더니 다음의 조건을 만족하는 글꼴을 직접 밀어 넣어야 된다는 것이다.

  • TrueType Font(.ttf) 형식
  • 유니코드 범위가 완전하고
  • 단순한 글꼴 구조(복잡한 OpenType 기능이나 CID 맵핑 없음... 무슨 소리인지?)
  • 라이선스가 자유롭고 경량화된 들꼴

ChatGPT에서 한글을 포함하는 PDF 문서를 만들려면 FPDF(단순 문서, 요약 등 간단하고 빠른 작업)이나 ReportLab(논문, 서식지, 다단 문서, 표 포함 문서 등)이라는 것을 써야 하는데, 그 성능에는 조금씩 차이가 있다. 둘 다 파이썬에서 PDF를 생성해 주는 것으로, 앞의 것이 매우 가볍고 빠른 경량 라이브러리이고(원래 PHP용으로 개발) 뒤의 것은 전문적인 PDF 문서를 생성하는 강력한 엔진이라고 한다. 안타깝게도 윈도우 기본 한글 글꼴로는 문제를 일으키는 경우가 많다고 한다. 따라서 다른 무료 글꼴을 사용하는 것을 권장한다. 



권장 글꼴 조합은 다음과 같다. 


예전에 워드 클라우드를 만들 때에는 파이썬 라이브러리를 직접 업로드해야 했는데, 이번 PDF 문서 생성 작업에서는 그걸 요구하지는 않는다. 반면에 글꼴은 넣으라고 한다. ChatGPT가 모든 것을 다 알아서 해결해 주면 좋겠지만 라이선스 문제가 있으니 사용자가 중간 과정을 처리해 줘야 하는 것 같다.

다음은 나눔고딕(Regular/Bold)를 적용하여 ReportLab으로 만든 문서의 스크린샷이다. 처음 시도했던 결과물에서는 줄바꿈이 되지 않고 줄 간격이 16pt로 다소 좁아서 이를 개선해 달라고 하였다. 줄 간격은 24pt로 늘렸고, 문단 사이 간격도 더욱 늘려서 가독성을 좋게 하였다.



ChatGPT에 작업을 요구할 때에는 아주 구체적으로 해야 한다는 것을 다시금 깨달았다.


2025년 6월 12일 업데이트

📄 한글 PDF 출력용 텍스트 생성 가이드 템플릿

✅ 1. 기본 요청 문구 (복사하여 그대로 사용 가능)

이 텍스트를 A4 크기의 한글 PDF로 출력 가능한 형태로 정리해 줘.
- 줄바꿈이 잘 되도록 문단을 정돈해 줘. - 여백은 좌우 20mm, 위아래 20mm로 맞춰 줘. - 줄간격은 약 1.4배로 해 줘. - 본문 글꼴은 '나눔고딕(NanumGothic)'을 사용하고, 제목에는 '나눔고딕 Bold'를 사용해 줘. - 글꼴 파일은 내가 업로드할 테니 그걸 적용해 줘. - 용지 밖으로 문장이 튀어나가지 않게 해 줘. - 단락마다 적당한 줄 간격(공백)도 넣어 줘. 최종적으로는 PDF 파일로 만들어 줘.

✅ 2. PDF에 적합한 문서 구성 예시

제목: 디지털 바이오 거버넌스의 미래
부제: 데이터 커먼즈와 WOBD를 중심으로 1. 서론 디지털 생명과학 시대에서 데이터는 개인의 프라이버시와 동시에 공공성을 갖는 중요한 자원이 되었다. 본 문서에서는... 2. 데이터 커먼즈란 무엇인가 Elinor Ostrom의 공유지 원칙에 근거하여, 데이터 커먼즈는... 3. WOBD 사례 분석 미국 NSCEB 보고서에서 제안한 Web of Biological Data는... 4. 정책적 시사점 이러한 구조를 한국에 도입하기 위해서는... 5. 결론 데이터 커먼즈는 무분별한 개방이 아닌, 조건부 신뢰 기반 공유를 뜻한다... (※ 각 섹션은 명확한 제목, 짧은 문단, 한글 줄바꿈 기준에 따라 정리)

✅ 3. 글꼴 사용 안내

  • 기본 본문 글꼴: NanumGothic.ttf

  • 제목/소제목 글꼴: NanumGothicBold.ttf

  • 필요 시 매 세션마다 업로드
    👉 업로드 예시:

    file-NanumGothic.ttf file-NanumGothicBold.ttf

✅ 4. 줄바꿈 잘 되는 문장 스타일 예시

  • 줄바꿈 안 되는 예시 (문장 하나가 너무 김):

    데이터 커먼즈란 단순히 데이터를 개방한다는 의미가 아니라, 공동체가 신뢰와 거버넌스를 바탕으로 지속 가능하게 운영하고 활용하는 구조를 말한다.
  • 줄바꿈 되는 예시 (적절한 길이로 문장 분리):

    데이터 커먼즈는 단순한 개방을 뜻하지 않는다.
    그것은 공동체가 신뢰와 규칙을 기반으로 데이터를 지속 가능하게 관리하는 구조이다.

✅ 5. 스타일 요약

항목설정 값
페이지 크기A4 (210x297mm)
여백좌우 20mm, 위아래 20mm
본문 글꼴나눔고딕 10.5pt
제목 글꼴나눔고딕 Bold 12.5–16pt
줄간격leading = 14 (1.4배 수준)
문단 간격단락 사이 8pt 이상
줄바꿈 처리자동 wrapping or <br/>
인코딩UTF-8 한글 지원 글꼴 필요

이 템플릿을 복사해 두셨다가 PDF 요청 시 활용하면 매번 줄바꿈이나 폰트 문제로 고생할 일이 없게 됩니다.

댓글 없음: