Apparatus for extracting event sentences in documents and method thereof

PURPOSE: A device and a method for extracting an event sentence from a document are provided to easily obtain useful data implying the domain dependent information from the document by automatically learning a document set related to a subject of each domain and extracting the event sentence includi...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KIM, TAE HYEON, YOON, BO HYEON, LIM, MYEONG EUN
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:PURPOSE: A device and a method for extracting an event sentence from a document are provided to easily obtain useful data implying the domain dependent information from the document by automatically learning a document set related to a subject of each domain and extracting the event sentence including concrete contents of an event related to the subject handled in the domain through the learned information. CONSTITUTION: A language processor(10) performs morpheme analysis and object name recognition for the learning document set(11) related to the subject of each domain. A document set learning part(20) extracts the specified qualities(21-23) by using a result of the language processor and selects/stores the important qualities. An event sentence extractor(30) extracts the event sentence from the extraction document(12) by using the result of the language processor and the document set learning part. 본 발명은 문서에서 이벤트 문장을 추출하는 장치 및 그 방법에 관한 것이다. 본 발명은 언어처리부(10)에서 입력 문서집합에 대해 형태소 분석 및 개체명 인식을 수행하고, 문서집합 학습부(20)에서 학습용 문서들을 언어처리한 결과를 이용해 동사, 명사 및 명사구 자질을 추출하고 각각에 대한 가중치를 계산함으로써 중요 자질을 선택해 데이터베이스에 저장하며, 이벤트 문장 추출부(30)에서 언어처리부(10)가 추출용 문서를 언어처리한 결과와 문서집합 학습부(20)가 학습한 결과를 비교 분석함으로써 추출용 문서 내의 각 문장에 대한 가중치를 계산하고 추출 조건에 따라 이벤트 문장을 추출하도록 되어 있으며, 이에 따라서, 문서로부터 도메인 의존적인 정보를 함축하고 있는 유용한 자료들을 선별하여 손쉽게 획득할 수 있다.