DATA QUALITY ANALYSIS
Systems, products, and methods is described for determining a data quality rule for a particular field of a dataset. The method includes analyzing data records in one or more particular instances of the dataset, including analyzing data elements for the particular field for the analyzed data records...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Systems, products, and methods is described for determining a data quality rule for a particular field of a dataset. The method includes analyzing data records in one or more particular instances of the dataset, including analyzing data elements for the particular field for the analyzed data records to determine a reference profile for the particular field for the analyzed data records in the one or more particular instances of the dataset; and based on the reference profile, determining a data quality rule for the particular field of the dataset. The data quality rule is indicative of (i) an allowable deviation between the reference profile and a profile for the particular field of an instance of the dataset, (ii) an allowable value for a data element for the particular field of a data record of an instance of the dataset, or (iii) a prohibited value for a data element for the particular field of a data record of an instance of the dataset.
Des systèmes, des produits et des méthodes sont décrits pour déterminer une règle de qualité des données pour un champ en particulier d'un ensemble de données. La méthode comprend l'analyse de fiches de données dans au moins une instance en particulier de l'ensemble de données, y compris l'analyse des éléments de données du champ en particulier des fiches de données analysées pour déterminer un profil de référence pour le champ en particulier pour les fiches de données analysées dans toute instance en particulier de l'ensemble de données. En fonction du profil de référence, une règle de qualité des données pour le champ en particulier de l'ensemble de données est déterminée. La règle de qualité des données est indicative de ce qui suit : (i) une déviation acceptable entre le profil de référence et un profil du champ en particulier dans une instance de l'ensemble de données; (ii) une valeur acceptable d'un élément de données pour le champ en particulier d'une fiche de données d'une instance de l'ensemble de données; ou (iii) une valeur interdite d'un élément de données pour le champ en particulier d'une fiche de données d'une instance de l'ensemble de données. |
---|