SYSTEMS AND METHODS FOR ENTITY RESOLUTION
Systems and methods for performing entity resolution. In some aspects, the system obtains a plurality of attributes represented in a plurality of records from one or more sources. The system generates a plurality of match vectors based on the plurality of attributes. Each match vector includes a set...
Gespeichert in:
Hauptverfasser: | , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Systems and methods for performing entity resolution. In some aspects, the system obtains a plurality of attributes represented in a plurality of records from one or more sources. The system generates a plurality of match vectors based on the plurality of attributes. Each match vector includes a set of attributes that match between a pair of records and a remaining set of attributes that are not required to match between the pair of records. The system processes the plurality of match vectors using an entity resolution model trained to output a binary indicator regarding whether one or more pairs of records for a match vector be merged. The system merges the one or more pairs of records for each match vector of the plurality of match vectors having a corresponding binary indicator output from the entity resolution model that pairs of records for the match vector be merged.
La présente invention concerne des systèmes et des procédés de résolution d'entité Selon certains aspects, le système obtient, en provenance d'une ou de plusieurs sources, une pluralité d'attributs représentés dans une pluralité d'enregistrements. Le système génère une pluralité de vecteurs de correspondance sur la base de la pluralité d'attributs. Chaque vecteur de correspondance comprend un ensemble d'attributs qui correspondent entre une paire d'enregistrements et un ensemble restant d'attributs qui ne doivent pas correspondre entre la paire d'enregistrements. Le système traite la pluralité de vecteurs de correspondance à l'aide d'un modèle de résolution d'entité entraîné pour délivrer en sortie un indicateur binaire précisant si une ou plusieurs paires d'enregistrements pour un vecteur de correspondance sont fusionnées. Le système fusionne la ou les paires d'enregistrements pour chaque vecteur de correspondance de la pluralité de vecteurs de correspondance ayant un indicateur binaire correspondant, délivré par le modèle de résolution d'entité, précisant que des paires d'enregistrements pour le vecteur de correspondance sont fusionnées. |
---|