SIMILAR PATENT SEARCH SERVICE SYSTEM AND METHOD

The present invention relates to a system for a similar patent searching service capable of automatically classifying a patent document and searching for a similar patent and a method thereof. According to an embodiment of the present invention, the system for a similar patent searching service comp...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: LIM HYUN KEUN, JUNG HOE KYUNG
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The present invention relates to a system for a similar patent searching service capable of automatically classifying a patent document and searching for a similar patent and a method thereof. According to an embodiment of the present invention, the system for a similar patent searching service comprises: a document pretreatment unit performing morpheme analysis for text extracted from a patent document inputted as an analysis target to extract words; a document analysis unit using a text rank algorithm to select an important keyword from the words and using a multi-label classification module constructed based on classification data for learning to classify an international patent classification (IPC) of the analysis target; a patent search unit searching for a patent document to be compared in a patent information search site based on the important keyword and an IPC classification result; and a patent topic analysis unit using a latent Dirichlet allocation (LDA) algorithm to analyze a topic of the analysis target and a comparison target and measuring the similarity between the analysis target and the comparison target in accordance with an analysis result. 본 발명의 일 실시예에 따른 유사 특허 검색 서비스 시스템은 분석 대상으로서 입력된 특허 문서로부터 추출된 텍스트를 형태소 분석하여 단어를 추출하는 문서 전처리부; 텍스트 랭크(Text Rank) 알고리즘을 이용하여 상기 단어 중에서 중요 키워드를 선별하고, 학습용 분류 데이터를 기반으로 구축된 다중 레이블 분류 모델을 이용하여 상기 분석 대상의 IPC(International Patent Classification)를 분류하는 문서 분석부; 상기 중요 키워드 및 상기 IPC의 분류 결과에 기초하여 특허 정보 검색 사이트로부터 비교 대상의 특허 문서를 검색하는 특허 검색부; 및 LDA(Latent Dirichlet Allocation) 알고리즘을 이용하여 상기 분석 대상 및 상기 비교 대상의 토픽(Topic)을 분석하고, 상기 분석의 결과에 따라 상기 분석 대상과 상기 비교 대상의 유사도를 측정하는 특허 토픽 분석부를 포함한다.