SYSTEMS AND METHODS FOR PERFORMING A COMPUTER-IMPLEMENTED PRIOR ART SEARCH

In some embodiments, a computer-implemented method for retrieving a similar document from a corpus of documents is provided. The method may include receiving a search document comprising a set of words; applying a first encoder to generate a first vector; applying a second encoder to generate a seco...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: FLEIG, JOHN DAVID, WILSON, JEFFREY MICHAEL, AYALA, PHILIPPE YVES, GRABAU, MARK RYAN, GESSNER, CHRISTOPHER RYAN, POLSHAKOV, DMITRII ARKADYEVICH, DENG, YI, FULFORD, RODNEY LAROY, SWARTWOUT, DONALD EUGENE
Format: Patent
Sprache:eng ; fre
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:In some embodiments, a computer-implemented method for retrieving a similar document from a corpus of documents is provided. The method may include receiving a search document comprising a set of words; applying a first encoder to generate a first vector; applying a second encoder to generate a second vector; determining a first similarity between the first vector of the search document and the first vector of each document of the corpus of documents; determining a second similarity between the second vector of the search document and the second vector of each document of the corpus of documents; generating a first ranked list of documents based on the first similarity; generating a second ranked list of documents based on the second similarity; applying a voting algorithm to determine a score associated with each document; and outputting a third ranked list of documents based on the determined score. Dans certains modes de réalisation, l'invention concerne un procédé mis en uvre par ordinateur pour récupérer un document similaire à partir d'un corpus de documents. Le procédé peut consister à recevoir un document de recherche comprenant un ensemble de mots ; appliquer un premier codeur pour générer un premier vecteur ; appliquer un second codeur pour générer un second vecteur ; déterminer une première similarité entre le premier vecteur du document de recherche et le premier vecteur de chaque document du corpus de documents ; déterminer une seconde similarité entre le second vecteur du document de recherche et le second vecteur de chaque document du corpus de documents ; générer une première liste classée de documents sur la base de la première similarité ; générer une deuxième liste classée de documents sur la base de la seconde similarité ; appliquer un algorithme de vote pour déterminer un score associé à chaque document ; et émettre une troisième liste classée de documents sur la base du score déterminé.