HWP, AI를 만나다: 챗GPT가 열어젖힌 봉인된 문서함
어떤 기계도 들어갈 수 없었던 금고
AI 초강국을 선언한 나라가 있습니다. 수천억 원을 소버린 AI에 쏟아붓고, 정예 연구 컨소시엄을 꾸리고, AI 기본법까지 제정했습니다. 그런데 서강대학교의 한 연구자는 지금도 책상 앞에서 마우스 매크로를 돌리고 있습니다. 정부 보고서를 하나씩 열어 PDF로 저장하는 수작업입니다. 전 세계 어떤 AI도 그 파일 안의 텍스트를 직접 해석할 수 없기 때문입니다. 파일 형식은 HWP. 나라는 대한민국. 공공문서의 91퍼센트가 이 형식으로 작성되어 있습니다.
2026년 4월 17일, 오픈AI는 챗GPT가 HWP와 HWPX 파일을 별도 변환 없이 직접 읽는다고 발표했습니다. 문서를 올리고, 자연어로 질문하면, 답이 돌아옵니다. 반가운 소식임에 틀림없습니다. 그러나 안도의 한숨을 내쉬기에는 하나가 걸립니다. 이 문제는 처음부터 우리가 스스로 만든 것이었다는 사실 말입니다.
저항에서 태어나 관성으로 굳어진 포맷
한 나라가 어떻게 자국의 지식을 스스로 봉인하게 되었는지 이해하려면, 1998년으로 돌아가야 합니다. 외환위기의 충격 속에서 한글과컴퓨터는 파산 직전에 몰렸고, 마이크로소프트는 소스코드를 넘기는 조건으로 투자를 제안했습니다. 사실상 한글 워드프로세서의 종말을 뜻하는 거래였습니다. 벤처업계와 시민단체가 ‘한글지키기운동본부’를 결성하여 약 100억 원을 모았고, 정부는 공공부문 문서 표준으로 HWP를 채택했습니다.
그 결정에는 무게가 있었습니다. 기술 종속에 맞선 디지털 주권의 선언이었습니다. 비극은 그 결정 자체가 아니라 그 이후 아무 일도 일어나지 않았다는 데 있습니다. 30년 가까이, 세계가 개방형 표준과 기계 판독 가능 데이터와 인공지능으로 변모하는 동안, 이 포맷은 관료 체계의 한가운데에서 단 한 번도 심각하게 재검토되지 않았습니다. HWP는 독자적 바이너리 포맷입니다. 자동화된 구문 분석에 저항하고, 한컴 라이선스 없이는 열리지도 않습니다. 법원 판결문, 정책 백서, 학술 자료, 행정 기록—수십 년간 축적된 한국어 공공 데이터가 해마다 높아지는 벽 뒤에 쌓여만 갔습니다.
문을 열지 않기로 선택한 사람들
글로벌 빅테크가 이 벽을 우연히 발견하고 어깨를 으쓱한 것이 아닙니다. 그들의 무대응에는 계산이 있었습니다. 마이크로소프트에게 경쟁사 포맷의 수명을 연장할 이유란 없었습니다. 시간이 지나면 한국 기관들이 자연스럽게 .docx로 넘어올 것이라는 조용한 내기—분석가들은 이를 ‘전략적 방치’라 부릅니다. 구글은 또 다른 셈법 앞에 서 있었습니다. 한 나라의 공공 부문에서만 쓰이는 포맷에 전담 엔지니어링 자원을 투입할 투자 대비 효율이 늘 기준선에 미치지 못했던 것입니다.
한컴은 2021년 개방형 후속 포맷 HWPX를 내놓았습니다. 국가표준 KS X 6101로 지정되어 사양이 공개되어 있고, 개인 개발자가 크롬 확장 프로그램으로 뷰어를 만들 수 있을 정도입니다. 장벽은 순전히 기술적인 것이 아니었습니다. 한컴 라이선스에 묶인 조달 계약, 하나의 인터페이스에 익숙해진 공무원, 포맷 전환을 늘 ‘다음 부서의 일’로 미루는 관료 문화—이 습관의 생태계가 진짜 벽이었습니다. 2025년 조사에서 정부 응답자의 91.1퍼센트가 공식 보고서를 여전히 HWP로 작성한다고 답했습니다. 정부는 자기 문서를 기계가 읽을 수 있는 형태로 바꾸는 데만 한 해 7200만 원을 썼습니다. 자기가 쓴 문서를 자기 돈으로 해독하는 역설, 이보다 더 정확한 관성의 초상이 있을까요.
오픈AI의 행보가 드러내는 것, 그리고 고칠 수 없는 것
오픈AI의 결정은 선의가 아닙니다. 5200만 인구, 세계 최고 수준의 AI 도입률, 그러면서도 공공 부문만은 어떤 글로벌 AI 서비스에도 사실상 접근 불가였던 시장—이 틈새를 선점하기 위한 계산된 움직임입니다. 마이크로소프트와 구글이 건너뛴 마찰을 챗GPT가 흡수함으로써, 한국 공공 부문과의 접점에서 유일한 글로벌 AI로 자리매김하는 것입니다. 영리한 전략이지만, 하나의 서비스 업데이트가 인프라 개혁을 대신할 수는 없습니다.
영국은 2014년부터 정부 문서에 개방형 문서 포맷(ODF)을 의무화했습니다. 유럽연합은 2025년 6월 발효된 접근성법으로 공공기관의 개방 표준을 강화했고, 미국은 연방기관에 WCAG 2.0 Level AA 준수를 요구합니다. 이들 국가는 문서란 사람만 읽는 것이 아니라 기계가 해석하고 연결하고 학습하는 데이터라는 사실을 일찍이 이해했습니다. AI 초강대국을 선언해 놓고 행정안전부가 기계 판독이란 개념 자체가 없던 시절에 설계된 포맷을 급히 뜯어고치는 대한민국의 모습은, 야망과 인프라 사이의 간극을 그대로 보여줍니다.
주권은 외주를 줄 수 없습니다
이 소식을 해피엔딩으로 소비하고 싶은 유혹이 있습니다. 글로벌 AI가 한국 공문서를 읽게 되었으니 문제는 해결된 것 아닌가. 그러나 이 프레임이 만드는 종속을 생각해 보십시오. 오픈AI가 다음 분기에 HWP 지원의 엔지니어링 비용이 정당화되지 않는다고 판단하면, 한국의 공공 데이터는 다시 봉인된 금고로 돌아갑니다. 병목의 위치만 바뀔 뿐입니다. 진정한 디지털 주권은 실리콘밸리의 기업이 자국 문서함을 열어주기를 기다리는 것이 아닙니다. 문서가 만들어지는 순간부터 기계가 읽을 수 있는 개방형 형식을 의무화하는 것, 변환 예산도 마우스 매크로도 필요 없는 구조를 처음부터 설계하는 것입니다.
한컴의 HWPX가 국제 호환성의 한계에도 불구하고 그 방향으로 작은 걸음을 내딛고 있기는 합니다. 공개된 사양은 적어도 공공문서가 시민의 것이라는 원칙—시민이 점점 더 의존하는 기계의 것이기도 하다는 원칙—을 인정하고 있습니다. 한국의 공공기관이 챗GPT의 업데이트를 편안히 주저앉을 핑계로 삼을 것인지, 아니면 기존 체제가 본래 지탱 가능한 것이 아니었다는 증거로 받아들일 것인지—그 선택이 파일 호환성보다 훨씬 더 큰 것을 결정합니다. 한국의 AI 야망이 스스로 통제하는 토대 위에 서느냐, 외국 기업의 선의에 기대느냐가 걸려 있습니다.
포맷은 그저 포맷이 아닙니다. 누가 읽을 수 있고, 누가 알 수 있으며, 누가 과거의 기록으로부터 미래를 세울 수 있는지를 결정하는 정치적 선택입니다. 금고는 열렸습니다—외부의 손에 의해. 문서를 봉인하고, 해마다 자물쇠의 존재를 의심하지 않은 채 서류를 쌓아 올린 이들에게 이제 남은 질문은 생각보다 단순합니다. 언제쯤 금고를 짓는 일 자체를 그만둘 것인가.


댓글 쓰기