ENTITY RESOLUTION DATA STRUCTURE SYSTEM AND METHOD

An entity resolution data structure system compares two data graphs by creating a confusion matrix in a distributed processing environment. A benchmark file is created from one data graph for comparison to a reference data graph. Identifiers and metadata are appended to the benchmark file to allow t...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: TALLEY, TERRY MICHAEL, COLLINS, DWAYNE, ZIMMERMAN, ADAM
Format: Patent
Sprache:eng ; fre
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:An entity resolution data structure system compares two data graphs by creating a confusion matrix in a distributed processing environment. A benchmark file is created from one data graph for comparison to a reference data graph. Identifiers and metadata are appended to the benchmark file to allow the comparison to take place and the construction of a confusion matrix. The confusion matrix provides a high-level indication of the results of the comparison. When the data graphs contain personally identifiable information (Pll), the process does not require any Pll to be transmitted in either direction between the parties who maintain the data graphs to be compared. Un système de structure de données de résolution d'entité compare deux graphes de données par création d'une matrice de confusion dans un environnement de traitement distribué. Un fichier étalon est créé à partir d'un graphe de données en vue d'une comparaison à un graphe de données de référence. Des identifiants (ID) et des métadonnées sont annexés au fichier étalon pour permettre la réalisation de la comparaison et la construction d'une matrice de confusion. La matrice de confusion fournit une indication de haut niveau des résultats de la comparaison. Quand les graphes de données contiennent des informations personnellement identifiables (Pll), le processus ne nécessite aucune transmission de PII dans un sens ou dans l'autre entre les parties qui maintiennent les graphes de données à comparer.