한글漢字 자동 변환 기술

한글漢字自動變換技術이란?

“한글漢字自動變換技術”은 문서 속에 한글로 표시된 한자어(漢字語)에 대해 문장 및 문서 단위로 한꺼번에 한글을 漢字로 자동변환을 해주는 기술로서, (사)전통문화연구회 부설 동양고전정보화연구소(소장 金炫김현, 한국학중앙연구원 인문정보학 교수)에서 제공하고 있는 웹사이트와 워드프로세서 등에 탑재되어 자동 변환을 지원해 주는 프로그램 및 기술을 통칭합니다.

핵심기술 및 기반데이터

초기 한글漢字 自動變換 技術은 울산대학교 한국어처리연구실 옥철영 교수 연구팀이 연구 발표한 유태거(UTagger)와 한국어 형태소 분석기를 기본 변환 기술로 하여 전통문화연구회가 한글한자자동변환 분야에 대해 다년간 지속적으로 공동연구를 진행하여 서비스하였으며 현재(2020년)는 동양고전정보화연구소에서 자체 개발하고 있는 字路-JEngine(AI 한자자동변환엔진)을 이용하여 변환률과 정확도를 높이고 있다.
2022년 현재 2억 3천 어절 이상의 현대문헌 및 고전문헌 말뭉치를 형태소・의미 분석 학습데이터를 보유하고 있으며 매년 1500만어절 이상의 현대, 고전문헌 의미분석 말뭉치가 새롭게 구축되고 있다.

서비스 제품 및 특징

(1) 서비스 제품

“漢字路” 한글자동변환 웹사이트 (http://hanjaro.juntong.or.kr)
“漢字路” 한글자동변환 워드프로세스용 애드인 – 한컴오피스용
“漢字路”한글자동변환 워드프로세스용 애드인 – MS-Office용

(2) 부가기능

변환될 한자를 중국 간체자(簡體字) 또는 일본 약자(略字)로도 선택 가능
사용자의 희망 용도에 따라 수준별・분야별 한자목록 지정 기능 및 다양한 옵션을 제공
“漢字路” 웹사이트에서는 일본어・중국어 사용자를 위한 다국어 페이지를 지원