DATA PROCESSING
A method and associated system. Entities within a first data source are identified. For each entity identified within the first data source, attributes of the entity identified within the first data source and/or relationships between the entity identified within the first data source and other enti...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A method and associated system. Entities within a first data source are identified. For each entity identified within the first data source, attributes of the entity identified within the first data source and/or relationships between the entity identified within the first data source and other entities identified within the first data source are identified. The attributes and/or relationships identified within the first data source are associated with a first entity identified within a data structure. For each entity identified within the first data source, a frequency metric characterizing the entity identified within the first data source is generated. The frequency metric is based on a frequency at which each attribute and/or relationship identified within the first data source is associated with the entity identified within the first data source. A degree of similarity between two entities of the entities is identified, by comparing the frequency metrics of the two entities.
La présente invention concerne un procédé et un système associé. Des entités sont identifiées dans une première source de données. Pour chaque entité identifiée dans la première source de données, les attributs de l'entité identifiée dans la première source de données et/ou les relations entre l'entité identifiée dans la première source de données et d'autres entités identifiées dans la première source de données sont identifiés. Les attributs et/ou les relations identifiés dans la première source de données sont associés à une première entité identifiée dans une structure de données. Pour chaque entité identifiée dans la première source de données, une mesure de fréquence caractérisant l'entité identifiée dans la première source de données est générée. Cette mesure de fréquence est basée sur la fréquence à laquelle chaque attribut et/ou relation identifié dans la première source de données est associée à l'entité identifiée dans la première source de données. Un degré de similarité entre deux entités des entités est identifié, par comparaison des mesures de fréquence des deux entités. |
---|