컴퓨터 구현 선행 기술 검색을 수행하기 위한 시스템들 및 방법들
일부 실시예들에서, 문서들의 코퍼스로부터 유사한 문서를 검색하기 위한 컴퓨터 구현 방법이 제공된다. 이 방법은: 단어들의 세트를 포함하는 검색 문서를 수신하는 단계; 제1 인코더를 적용하여 제1 벡터를 생성하는 단계; 제2 인코더를 적용하여 제2 벡터를 생성하는 단계; 검색 문서의 제1 벡터와 문서들의 코퍼스의 각각의 문서의 제1 벡터 사이의 제1 유사도를 결정하는 단계; 검색 문서의 제2 벡터와 문서들의 코퍼스의 각각의 문서의 제2 벡터 사이의 제2 유사도를 결정하는 단계; 제1 유사도에 기초하여 문서들의 제1 랭크된 리스트를 생...
Gespeichert in:
Hauptverfasser: | , , , , , , , , |
---|---|
Format: | Patent |
Sprache: | kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 일부 실시예들에서, 문서들의 코퍼스로부터 유사한 문서를 검색하기 위한 컴퓨터 구현 방법이 제공된다. 이 방법은: 단어들의 세트를 포함하는 검색 문서를 수신하는 단계; 제1 인코더를 적용하여 제1 벡터를 생성하는 단계; 제2 인코더를 적용하여 제2 벡터를 생성하는 단계; 검색 문서의 제1 벡터와 문서들의 코퍼스의 각각의 문서의 제1 벡터 사이의 제1 유사도를 결정하는 단계; 검색 문서의 제2 벡터와 문서들의 코퍼스의 각각의 문서의 제2 벡터 사이의 제2 유사도를 결정하는 단계; 제1 유사도에 기초하여 문서들의 제1 랭크된 리스트를 생성하는 단계; 제2 유사도에 기초하여 문서들의 제2 랭크된 리스트를 생성하는 단계; 투표 알고리즘을 적용하여 각각의 문서와 연관된 스코어를 결정하는 단계; 및 결정된 스코어에 기초하여 문서들의 제3 랭크된 리스트를 출력하는 단계를 포함할 수 있다.
In some embodiments, a computer-implemented method for retrieving a similar document from a corpus of documents is provided. The method may include receiving a search document comprising a set of words; applying a first encoder to generate a first vector; applying a second encoder to generate a second vector; determining a first similarity between the first vector of the search document and the first vector of each document of the corpus of documents; determining a second similarity between the second vector of the search document and the second vector of each document of the corpus of documents; generating a first ranked list of documents based on the first similarity; generating a second ranked list of documents based on the second similarity; applying a voting algorithm to determine a score associated with each document; and outputting a third ranked list of documents based on the determined score. |
---|