AGGREGATION OF NOISY DATASETS INTO MASTER FIRMOGRAPHIC DATABASE
Aggregation of noisy datasets into a master firmographic database. In an embodiment, firmographic records are received from a plurality of sources, and normalized into a common schema. One or more firmographic records may be cleaned by replacing a value of one or more fields in those firmographic re...
Gespeichert in:
Hauptverfasser: | , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Aggregation of noisy datasets into a master firmographic database. In an embodiment, firmographic records are received from a plurality of sources, and normalized into a common schema. One or more firmographic records may be cleaned by replacing a value of one or more fields in those firmographic record(s) with a value of those field(s) in another firmographic record. The firmographic records may then be clustered, and each of the clusters may be collapsed into a single conflated firmographic record based on a voting process. A master identifier may be generated for each conflated firmographic record, and the conflated firmographic records may be merged into a master firmographic database that is indexed by master identifiers.
Agrégation de jeux de données bruités en une base de données maîtresse de démographie des entreprises. Selon un mode de réalisation, des enregistrements de démographie des entreprises sont reçus en provenance d'une pluralité de sources, et normalisés en un schéma commun. Un ou plusieurs enregistrements de démographie des entreprises peuvent être nettoyés en remplaçant une valeur d'un ou plusieurs champs dans ledit ou lesdits enregistrements de démographie des entreprises par une valeur de ce(s) champ(s) dans un autre enregistrement de démographie des entreprises. Les enregistrements de démographie des entreprises peuvent ensuite être regroupés, et chacun des groupements peut être replié en un single enregistrement amalgamé de démographie des entreprises selon un processus de vote. Un identifiant maître peut être généré pour chaque enregistrement amalgamé de démographie des entreprises, et les enregistrements amalgamés de démographie des entreprises peuvent être fusionnés en une base de données maîtresse de démographie des entreprises qui est indexée par les identifiants maîtres. |
---|