MACHINE LEARNING TRAINING DURATION CONTROL

Some embodiments select a machine learning model training duration based at least in part on a fractal dimension calculated for a training data dataset. Model training durations are based on one or more characteristics of the data, such as a fractal dimension, a data distribution, or a spike count....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KARPOVSKY, Andrey, SALMAN, Tamer, SHTEINBERG, Eitan
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Some embodiments select a machine learning model training duration based at least in part on a fractal dimension calculated for a training data dataset. Model training durations are based on one or more characteristics of the data, such as a fractal dimension, a data distribution, or a spike count. Default long training durations are sometimes replaced by shorter durations without any loss of model accuracy. For instance, the time-to-detect for a model-based intrusion detection system is shortened by days in some circumstances. Model training is performed per a profile which specifies particular resources or particular entities, or both. Realistic test data is generated on demand. Test data generation allows the trained model to be exercised for demonstrations, or for scheduled confirmations of effective monitoring by a model-based security tool, without thereby altering the model's training. Certains modes de réalisation sélectionnent une durée d'entraînement de modèle d'apprentissage automatique sur la base, au moins en partie, d'une dimension fractale calculée pour un ensemble de données de données d'entraînement. Des durées d'entraînement de modèle sont basées sur une ou plusieurs caractéristiques des données, telles qu'une dimension fractale, une distribution de données ou un comptage de pics. Des durées d'entraînement longues par défaut sont parfois remplacées par des durées plus courtes sans aucune perte de précision de modèle. Par exemple, le temps de détection pour un système de détection d'intrusion basé sur un modèle est écourté de l'ordre de plusieurs jours dans certaines circonstances. Un entraînement de modèle est effectué par un profil qui spécifie des ressources particulières et/ou des entités particulières. Des données de test réalistes sont générées à la demande. La génération de données de test permet au modèle entraîné d'être exercé pour des démonstrations, ou pour des confirmations planifiées de surveillance efficace par un outil de sécurité basé sur un modèle, sans influer par là même sur l'entraînement du modèle.