METHOD OF EXTRACTION AND SUMMARY OF CATEGORICAL SENTENCES IN DOCUMENT

본 발명은 기업이나 경제 관련 기사 혹은 문서 내에서 범주형 문장이 존재하는지 여부를 판단하고 그에 따른 문장을 추출하여 요약하는 시스템 및 방법에 관한 것으로, 본 발명의 일 실시예에 의한 문서 내의 범주형 문장을 추출 및 요약하는 방법은 시스템의 수집부가 텍스트를 포함하는 문서를 수집하여 시스템의 데이터베이스에 저장하는 단계와 시스템의 전처리부가 수집한 문서에서 비텍스트(Non-Text) 및 상용문구를 제거하는 전처리를 수행하는 단계와 시스템의 중복 제거부가 전처리가 수행된 둘 이상의 문서의 중복도를 계산하여 하나의 문서를 데이...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HYEON GAK AHN, HYUNG JUN AHN, SUNG HWAN KIM, JIN WON KIM, WON SEOK CHA, IL HOON KIM, KYO JOONG OH
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:본 발명은 기업이나 경제 관련 기사 혹은 문서 내에서 범주형 문장이 존재하는지 여부를 판단하고 그에 따른 문장을 추출하여 요약하는 시스템 및 방법에 관한 것으로, 본 발명의 일 실시예에 의한 문서 내의 범주형 문장을 추출 및 요약하는 방법은 시스템의 수집부가 텍스트를 포함하는 문서를 수집하여 시스템의 데이터베이스에 저장하는 단계와 시스템의 전처리부가 수집한 문서에서 비텍스트(Non-Text) 및 상용문구를 제거하는 전처리를 수행하는 단계와 시스템의 중복 제거부가 전처리가 수행된 둘 이상의 문서의 중복도를 계산하여 하나의 문서를 데이터베이스에서 제거하는 단계와 시스템의 학습부가 문서에서 하나 이상의 문장을 추출하는 단계와 시스템의 요약부가 추출된 문장을 요약 문장으로 변환하는 단계와 시스템의 리포트 생성부가 변환된 요약 문장에 리포트 포맷을 적용하여 리포트를 생성하는 단계를 포함한다.