SYSTEMS AND METHODS FOR PERFORMING A COMPUTER-IMPLEMENTED PRIOR ART SEARCH

In some embodiments, a computer-implemented method for retrieving a similar document from a corpus of documents is provided. The method may include receiving a search document comprising a set of words; applying a first encoder to generate a first vector; applying a second encoder to generate a seco...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	FLEIG, JOHN DAVID, WILSON, JEFFREY MICHAEL, AYALA, PHILIPPE YVES, GRABAU, MARK RYAN, GESSNER, CHRISTOPHER RYAN, POLSHAKOV, DMITRII ARKADYEVICH, DENG, YI, FULFORD, RODNEY LAROY, SWARTWOUT, DONALD EUGENE
Format:	Patent
Sprache:	eng ; fre
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	In some embodiments, a computer-implemented method for retrieving a similar document from a corpus of documents is provided. The method may include receiving a search document comprising a set of words; applying a first encoder to generate a first vector; applying a second encoder to generate a second vector; determining a first similarity between the first vector of the search document and the first vector of each document of the corpus of documents; determining a second similarity between the second vector of the search document and the second vector of each document of the corpus of documents; generating a first ranked list of documents based on the first similarity; generating a second ranked list of documents based on the second similarity; applying a voting algorithm to determine a score associated with each document; and outputting a third ranked list of documents based on the determined score. Dans certains modes de réalisation, l'invention concerne un procédé mis en uvre par ordinateur pour récupérer un document similaire à partir d'un corpus de documents. Le procédé peut consister à recevoir un document de recherche comprenant un ensemble de mots ; appliquer un premier codeur pour générer un premier vecteur ; appliquer un second codeur pour générer un second vecteur ; déterminer une première similarité entre le premier vecteur du document de recherche et le premier vecteur de chaque document du corpus de documents ; déterminer une seconde similarité entre le second vecteur du document de recherche et le second vecteur de chaque document du corpus de documents ; générer une première liste classée de documents sur la base de la première similarité ; générer une deuxième liste classée de documents sur la base de la seconde similarité ; appliquer un algorithme de vote pour déterminer un score associé à chaque document ; et émettre une troisième liste classée de documents sur la base du score déterminé.