GENERATIVE SAMPLING FOR UNBALANCED OF CLASSES IN IMAGES AND VIDEOS DATASET

In example implementations described herein, there are systems and methods for training a machine-trained model for industrial failure detection based on an initial set of training data comprising a plurality of input-output data sets each comprising input data and output data regarding at least one...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: LIN, Wei, DAMO, Mauro Arduino
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:In example implementations described herein, there are systems and methods for training a machine-trained model for industrial failure detection based on an initial set of training data comprising a plurality of input-output data sets each comprising input data and output data regarding at least one classification of the input data. The method may include identifying at least one classification of the input data, in a plurality of classifications that is under-represented. The method may also include automatically generating, for inclusion in a modified set of training data, additional input-output data sets for the identified at least, one classification to balance a representation of the classifications in the modified set of training data. Finally, the method may include training the machine-trained model based on the modified set of training data comprising at least a subset of the initial set of training data and the additional input-output data sets. Dans des modes de réalisation donnés à titre d'exemple, l'invention concerne des systèmes et des procédés pour entraîner un modèle entraîné par machine pour une détection de défaillance industrielle sur la base d'un ensemble initial de données d'apprentissage comprenant une pluralité d'ensembles de données d'entrée-sortie comprenant chacun des données d'entrée et des données de sortie concernant au moins une classification des données d'entrée. Le procédé peut consister à identifier au moins une classification des données d'entrée, dans une pluralité de classifications qui sont sous-représentées. Le procédé peut également consister à générer automatiquement, pour une inclusion dans un ensemble modifié de données d'apprentissage, des ensembles de données d'entrée-sortie supplémentaires pour l'au moins une classification identifiée afin d'équilibrer une représentation des classifications dans l'ensemble modifié de données d'apprentissage. Enfin, le procédé peut consister à entraîner le modèle entraîné par machine sur la base de l'ensemble modifié de données d'apprentissage comprenant au moins un sous-ensemble de l'ensemble initial de données d'apprentissage et des ensembles de données d'entrée-sortie supplémentaires.