본문 바로가기
컴퓨터 활용(한글, 오피스 등)/기타

kordoc - 한글(hwp) 문서를 마크다운(md)로 변환

by 3604 2026. 4. 8.
728x90

목적

HWP, HWPX, PDF 등 대한민국 관공서에서 쏟아지는 모든 문서를 파싱하고, 비교하고, 분석하고, 생성하는 도구이다. 특히 AI 생태계에서 활용이 수월한 마크다운(Markdown) md 형식으로 바꾸는 것이 유용하다.

자료 받기

https://github.com/chrisryugj/kordoc

* 예시로 사용한 다운로드 파일
   kordoc-1.7.1.zip

설치 및 사용

. 설치 폴더 생성

    임시 폴더(C:\addon)에서 kordoc-1.7.1-releases.zip 압축 풀고 폴더명 kordoc로 변경
   (예시) C:\addon
   (예시) C:\addon\kordoc

. 윈도우의 Ubuntu24로 접속

   윈도우에서 ubuntu24로 접속 후 root 권한으로 변경
   "$DESKTOP-FTGPEGB:/mnt/c/addon"로 이동

. kordoc 설치

폴더($DESKTOP-FTGPEGB:/mnt/c/addon)에서 
   npm install kordoc

    npm install pdfjs-dist (선택)

. 파일 변환


    npx kordoc '26HS040.hwpx' -o 20270701.md
     ※ 한글 파일이 hwp인 경우는 hwpx로 변경 후 실행 할 것
     ※ 처리 결과
       Need to install the following packages:
       kordoc@2.2.6
       Ok to proceed? (y) y
       [kordoc] 26HS040.hwpx (hwpx) [2/2] OK
        → 20270701.md

사용 예

우리나라 법제처 국가법령정보센터에서는 현행 법률 문서(: HWPX 형식)를 다운로드하여 변환을 한다.

$ npx kordoc '개인정보 보호법(법률)(21445)(20270701).hwpx' -o 20270701.md

[출력 결과]

[kordoc] 개인정보 보호법(법률)(21445)(20270701).hwpx (hwpx) [2/2] OK

20270701.md

kordoc-1.7.1-releases.zip
2.37MB

HWP, HWPX, PDF 등 대한민국 관공서에서 쏟아지는 모든 문서를 파싱하고, 비교하고, 분석하고, 생성하는 도구이다. 특히 AI 생태계에서 활용이 수월한 마크다운(Markdown) md 형식으로 바꾸는 것이 유용하다.

출처:https://www.postype.com/@cpuu/post/21987188

 

728x90