TRAINING A MACHINE LEARNING SYSTEM FOR TRANSACTION DATA PROCESSING
A method of training a supervised machine learning system to detect anomalies within transaction data is described. The method includes obtaining a training set of data samples; assigning a label indicating an absence of an anomaly to unlabelled data samples in the training set; partitioning the dat...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A method of training a supervised machine learning system to detect anomalies within transaction data is described. The method includes obtaining a training set of data samples; assigning a label indicating an absence of an anomaly to unlabelled data samples in the training set; partitioning the data of the data samples in the training set into two feature sets, a first feature set representing observable features and a second feature set representing context features; generating synthetic data samples by combining features from the two feature sets that respectively relate to two different uniquely identifiable entities; assigning a label indicating a presence of an anomaly to the synthetic data samples; augmenting the training set with the synthetic data samples; and training a supervised machine learning system with the augmented training set and the assigned labels.
L'invention concerne un procédé de formation d'un système d'apprentissage automatique supervisé permettant de détecter des anomalies au sein de données de transaction. Le procédé consiste à obtenir un ensemble de formation d'échantillons de données ; à attribuer un marqueur indiquant une absence d'une anomalie à des échantillons de données non marqués dans l'ensemble de formation ; à partitionner les données des échantillons de données dans l'ensemble de formation en deux ensembles de caractéristiques, un premier ensemble de caractéristiques représentant des caractéristiques observables et un second ensemble de caractéristiques représentant des caractéristiques de contexte ; à générer des échantillons de données synthétiques en combinant des caractéristiques des deux ensembles de caractéristiques qui se rapportent respectivement à deux entités différentes identifiables de manière unique ; à attribuer un marqueur indiquant la présence d'une anomalie aux échantillons de données synthétiques ; à augmenter l'ensemble de formation avec les échantillons de données synthétiques ; et à former un système d'apprentissage automatique supervisé avec l'ensemble de formation augmenté et les marqueurs attribués. |
---|