번역지원 漢한병렬말뭉치

번역지원 漢한병렬말뭉치

동양고전정보화연구소는 동양고전 빠르고 정확한 번역 및 한문 학습을 위한 漢한 병렬 말뭉치 구축을 체계적으로 진행하고 있습니다.
이를 통해 지능형 동양 고전 번역 지원 시스템 개발, AI기반 기계번역 지원 및 한문 고전 전문 검색 엔진 개발에 활용할 수 있도록 하고 있습니다.

구축 자료 개요

2013년 교육부의 지원 사업인 “고전문헌국역사업”의 일환으로 시작된 “동양고전어휘정보화사업”에서 2017년부터 본격적인 漢한 병렬 말뭉치 구축을 진행하여 3000만 어절의 문장 단위 병렬말뭉치 및 절, 구 단위의 병렬 말뭉치를 동시에 구축하고 있습니다. 매년 1,500만 어절 이상의 병렬 말뭉치를 신규로 구축하고 있습니다.

전통 漢한 병렬 말뭉치 특징

– 한국내 주요 한문 고전 및 고문서등의 한글 번역을 포괄
– 기본 문장 단위 원문, 한글에 대한 병렬 및 세부적인 절,구 단위 분석
– 한글 번역문에 대한 형태 의미 분석을 동시에 진행
– 번역문에 사용된 한자 어휘에 대한 한자 병기
– 기계 번역(AI번역)에 적합한 정제 번역문 생성