컴퓨터 구현 선행 기술 검색을 수행하기 위한 시스템들 및 방법들

일부 실시예들에서, 문서들의 코퍼스로부터 유사한 문서를 검색하기 위한 컴퓨터 구현 방법이 제공된다. 이 방법은: 단어들의 세트를 포함하는 검색 문서를 수신하는 단계; 제1 인코더를 적용하여 제1 벡터를 생성하는 단계; 제2 인코더를 적용하여 제2 벡터를 생성하는 단계; 검색 문서의 제1 벡터와 문서들의 코퍼스의 각각의 문서의 제1 벡터 사이의 제1 유사도를 결정하는 단계; 검색 문서의 제2 벡터와 문서들의 코퍼스의 각각의 문서의 제2 벡터 사이의 제2 유사도를 결정하는 단계; 제1 유사도에 기초하여 문서들의 제1 랭크된 리스트를 생...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: DENG YI, POLSHAKOV DMITRII ARKADYEVICH, FULFORD RODNEY LAROY, GRABAU MARK RYAN, GESSNER CHRISTOPHER RYAN, SWARTWOUT DONALD EUGENE, FLEIG JOHN DAVID, WILSON JEFFREY MICHAEL, AYALA PHILIPPE YVES
Format: Patent
Sprache:kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:일부 실시예들에서, 문서들의 코퍼스로부터 유사한 문서를 검색하기 위한 컴퓨터 구현 방법이 제공된다. 이 방법은: 단어들의 세트를 포함하는 검색 문서를 수신하는 단계; 제1 인코더를 적용하여 제1 벡터를 생성하는 단계; 제2 인코더를 적용하여 제2 벡터를 생성하는 단계; 검색 문서의 제1 벡터와 문서들의 코퍼스의 각각의 문서의 제1 벡터 사이의 제1 유사도를 결정하는 단계; 검색 문서의 제2 벡터와 문서들의 코퍼스의 각각의 문서의 제2 벡터 사이의 제2 유사도를 결정하는 단계; 제1 유사도에 기초하여 문서들의 제1 랭크된 리스트를 생성하는 단계; 제2 유사도에 기초하여 문서들의 제2 랭크된 리스트를 생성하는 단계; 투표 알고리즘을 적용하여 각각의 문서와 연관된 스코어를 결정하는 단계; 및 결정된 스코어에 기초하여 문서들의 제3 랭크된 리스트를 출력하는 단계를 포함할 수 있다. In some embodiments, a computer-implemented method for retrieving a similar document from a corpus of documents is provided. The method may include receiving a search document comprising a set of words; applying a first encoder to generate a first vector; applying a second encoder to generate a second vector; determining a first similarity between the first vector of the search document and the first vector of each document of the corpus of documents; determining a second similarity between the second vector of the search document and the second vector of each document of the corpus of documents; generating a first ranked list of documents based on the first similarity; generating a second ranked list of documents based on the second similarity; applying a voting algorithm to determine a score associated with each document; and outputting a third ranked list of documents based on the determined score.