목적
HWP, HWPX, PDF 등 대한민국 관공서에서 쏟아지는 모든 문서를 파싱하고, 비교하고, 분석하고, 생성하는 도구이다. 특히 AI 생태계에서 활용이 수월한 마크다운(Markdown) md 형식으로 바꾸는 것이 유용하다.
자료 받기
https://github.com/chrisryugj/kordoc
* 예시로 사용한 다운로드 파일
kordoc-1.7.1.zip
설치 및 사용
가. 설치 폴더 생성
임시 폴더(C:\addon)에서 kordoc-1.7.1-releases.zip 압축 풀고 폴더명 kordoc로 변경
(예시) C:\addon
(예시) C:\addon\kordoc
나. 윈도우의 Ubuntu24로 접속
윈도우에서 ubuntu24로 접속 후 root 권한으로 변경
"$DESKTOP-FTGPEGB:/mnt/c/addon"로 이동
다. kordoc 설치
폴더($DESKTOP-FTGPEGB:/mnt/c/addon)에서
npm install kordoc
npm install pdfjs-dist (선택)
라. 파일 변환
npx kordoc '26HS040.hwpx' -o 20270701.md
※ 한글 파일이 hwp인 경우는 hwpx로 변경 후 실행 할 것
※ 처리 결과
Need to install the following packages:
kordoc@2.2.6
Ok to proceed? (y) y
[kordoc] 26HS040.hwpx (hwpx) [2/2] OK
→ 20270701.md
사용 예
우리나라 법제처 국가법령정보센터에서는 현행 법률 문서(예: HWPX 형식)를 다운로드하여 변환을 한다.
$ npx kordoc '개인정보 보호법(법률)(제21445호)(20270701).hwpx' -o 20270701.md
[출력 결과]
[kordoc] 개인정보 보호법(법률)(제21445호)(20270701).hwpx (hwpx) [2/2] OK
→ 20270701.md
HWP, HWPX, PDF 등 대한민국 관공서에서 쏟아지는 모든 문서를 파싱하고, 비교하고, 분석하고, 생성하는 도구이다. 특히 AI 생태계에서 활용이 수월한 마크다운(Markdown) md 형식으로 바꾸는 것이 유용하다.
출처:https://www.postype.com/@cpuu/post/21987188
'컴퓨터 활용(한글, 오피스 등) > 기타' 카테고리의 다른 글
| Claude가 대한민국 법전을 읽다: korean-law-mcp 연동 가이드 (0) | 2026.04.09 |
|---|---|
| Wi-Fi 연결 및 확인 방법 (0) | 2026.04.09 |
| Ubuntu를 기반으로 IaaS, PaaS, SaaS 환경 구축 (0) | 2026.04.08 |
| Claude Code 소스코드_AI 에이전트 앱 ‘클로드 코드’를 구동하는 기본 명령어(시스템 프롬프트) 소스코드 (0) | 2026.04.04 |
| 서비스가 컨테이너 기반의 MSA 구조로 설계 방법은? (0) | 2026.04.02 |