REDUCING INSTANCES OF INCLUSION OF DATA ASSOCIATED WITH HINDSIGHT BIAS IN A TRAINING SET OF DATA FOR A MACHINE LEARNING SYSTEM
Instances of data associated with hindsight bias in a training set of data for a machine learning system can be reduced. A first set of data, having a first set of fields, can be received. Data in a first field can be analyzed with respect to data in a second field corresponding to an event to be pr...
Gespeichert in:
Hauptverfasser: | , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Instances of data associated with hindsight bias in a training set of data for a machine learning system can be reduced. A first set of data, having a first set of fields, can be received. Data in a first field can be analyzed with respect to data in a second field corresponding to an event to be predicted. A result can be that the data in the first field is associated with hindsight bias. A second set of data, having a second set of fields, can be produced. The second set of fields can exclude the first field. One or more features associated with the second set of data can be generated. A third set of data, having the second set of fields and fields that correspond to the one or more features, can be produced. The training set of data can be produced using the third set of data.
Des instances de données associées à un biais rétrospectif dans un ensemble d'apprentissage de données pour un système d'apprentissage automatique peuvent être réduites. Un premier ensemble de données comprenant un premier ensemble de champs peut être reçu. Des données dans un premier champ peuvent être analysées par rapport à des données dans un second champ correspondant à un événement qui doit être prédit. Un résultat peut être que les données dans le premier champ sont associées au biais rétrospectif. Un deuxième ensemble de données comprenant un second ensemble de champs peut être produit. Le deuxième ensemble de champs peut exclure le premier champ. Une ou plusieurs caractéristiques associées au deuxième ensemble de données peuvent être générées. Un troisième ensemble de données, comprenant le deuxième ensemble de champs et des champs qui correspondent au(x) caractéristique(s), peut être produit. L'ensemble d'apprentissage de données peut être produit à l'aide du troisième ensemble de données. |
---|