SYSTEMS AND METHODS FOR PERFORMING A COMPUTER-IMPLEMENTED PRIOR ART SEARCH
In some embodiments, a computer-implemented method for retrieving a similar document from a corpus of documents is provided. The method may include receiving a search document comprising a set of words; applying a first encoder to generate a first vector; applying a second encoder to generate a seco...
Gespeichert in:
Hauptverfasser: | , , , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | In some embodiments, a computer-implemented method for retrieving a similar document from a corpus of documents is provided. The method may include receiving a search document comprising a set of words; applying a first encoder to generate a first vector; applying a second encoder to generate a second vector; determining a first similarity between the first vector of the search document and the first vector of each document of the corpus of documents; determining a second similarity between the second vector of the search document and the second vector of each document of the corpus of documents; generating a first ranked list of documents based on the first similarity; generating a second ranked list of documents based on the second similarity; applying a voting algorithm to determine a score associated with each document; and outputting a third ranked list of documents based on the determined score.
Dans certains modes de réalisation, l'invention concerne un procédé mis en uvre par ordinateur pour récupérer un document similaire à partir d'un corpus de documents. Le procédé peut consister à recevoir un document de recherche comprenant un ensemble de mots ; appliquer un premier codeur pour générer un premier vecteur ; appliquer un second codeur pour générer un second vecteur ; déterminer une première similarité entre le premier vecteur du document de recherche et le premier vecteur de chaque document du corpus de documents ; déterminer une seconde similarité entre le second vecteur du document de recherche et le second vecteur de chaque document du corpus de documents ; générer une première liste classée de documents sur la base de la première similarité ; générer une deuxième liste classée de documents sur la base de la seconde similarité ; appliquer un algorithme de vote pour déterminer un score associé à chaque document ; et émettre une troisième liste classée de documents sur la base du score déterminé. |
---|