System for summarizing automatically arbitrary sentences

The present invention relates to a system for automatically summarizing documents in Korean. The system for automatically summarizing documents comprises: a model training device for pre-training using training data and completing a short summary generation model and a long summary generation model;...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HONG HYUN EUI, KOO MYOUNG WAN, CHOI YE RIN, LEE JEONG PIL
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The present invention relates to a system for automatically summarizing documents in Korean. The system for automatically summarizing documents comprises: a model training device for pre-training using training data and completing a short summary generation model and a long summary generation model; and a summary generating device generating a summary including an arbitrary number of sentences for an original text. The summary generating device comprises: an input module receiving the number of sentences in the original text and summary; a model decision module selecting one of the short summary generation model and the long summary generation model according to the number of input summary sentences; a summary generation module using a model selected by the model decision module and generating the summary of the original text; and a summary completion module, if the number of sentences forming the summary is greater than the number of sentences in the input summary, extracting sentences corresponding to the number of sentences in the input summary from the front of the summary and completing the summary. Accordingly, a summary including a number of sentences determined by a user can be automatically generated with excellent performance. 본 발명은 한국어 문서 자동 요약 시스템에 관한 것이다. 상기 문서 자동 요약 시스템은, 훈련 데이터를 이용하여 사전 학습시켜 짧은 요약문 생성 모델 및 긴 요약문 생성 모델을 완성하는 모델 학습 장치; 및 원문에 대하여 임의의 개수의 문장으로 이루어진 요약문을 생성하는 요약문 생성 장치;를 구비한다. 상기 요약문 생성 장치는, 원문 및 요약문 문장 개수를 입력받는 입력 모듈; 상기 입력된 요약문 문장 개수에 따라 짧은 요약문 생성 모델 및 긴 요약문 생성 모델 중 하나를 선택하는 모델 결정 모듈; 상기 모델 결정 모듈에 의해 선택된 모델을 이용하여 원문에 대한 요약문을 생성하는 요약문 생성 모듈; 및 요약문을 구성하는 문장 개수가 상기 입력된 요약문 문장 개수보다 크면 요약문의 앞에서부터 상기 입력된 요약문 문장 개수에 대응되는 문장들까지 추출하여 요약문을 완성하는 요약문 완성 모듈;을 구비한다.