PHRASE ALIGNMENT METHOD FOR TRAINING CORPUS OF SIMULTANEOUS MACHINE TRANSLATION

Provided is a method for aligning translation units for generating a corpus of simultaneous interpretation learning. According to the present invention, the method comprises: a step of receiving an input of a translation corpus by the unit of a sentence made of a pair of source and translation; a st...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: ROH YOON HYUNG
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Provided is a method for aligning translation units for generating a corpus of simultaneous interpretation learning. According to the present invention, the method comprises: a step of receiving an input of a translation corpus by the unit of a sentence made of a pair of source and translation; a step of analyzing morphemes and tagging word classes on the translation corpus by the unit of a sentence; a step of aligning words targeting the source words and the translation words on the translation corpus by the unit of a sentence; a step of generating candidates of aligning the translation units on the translation corpus by the unit of a sentence whose words have been aligned; and a step of engaging the candidates of aligning the translation units and generating the translation unit alignment list information for generating a simultaneous interpretation learning corpus. The present invention aims to provide a method for aligning translation unit for generating a corpus of simultaneous interpretation learning, which is capable of being used for developing a simultaneous interpretation machine. 동시통역 학습 코퍼스 생성을 위한 번역단위 정렬 방법이 제공된다. 상기 방법은 원문 및 대역문의 쌍으로 구성된 문장 단위의 대역 코퍼스를 입력받는 단계; 상기 문장 단위의 대역 코퍼스에 대한 형태소 분석 및 품사 태깅을 수행하는 단계; 상기 문장 단위의 대역 코퍼스에 대하여 원문 단어 및 대역 단어를 대상으로 단어 정렬을 수행하는 단계; 상기 단어 정렬이 수행된 문장 단위의 대역 코퍼스에 대한 번역단위 정렬 후보를 생성하는 단계; 및 상기 번역단위 정렬 후보를 결합하여 동시통역 학습 코퍼스 생성을 위한 번역단위 정렬 리스트 정보를 생성하는 단계를 포함한다.