RANDOM STRINGS CLASSIFICATION FOR DETECTING SUSPICIOUS NETWORK ACTIVITIES

A computing system is configured to train a machine-learning model for detecting suspicious network activities based on a training dataset. The training of the machine-learning model may be supervised or unsupervised training. The training dataset includes multiple strings. For each of the multiple...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MAKHLEVICH, Michael, KARPOVSKY, Andrey, NASERELDEEN, Fady, ROTSTEIN, Tomer
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A computing system is configured to train a machine-learning model for detecting suspicious network activities based on a training dataset. The training of the machine-learning model may be supervised or unsupervised training. The training dataset includes multiple strings. For each of the multiple strings, the computing system extracts one or more N-grams substrings, where N is a natural number that is equal to or greater than 2. The computing system then determines a probability of each N-grams substring that may occur in a string. When the machine-learning model is executed, it is configured to classify whether a given string contained in network communication is a random string. In response to classifying that the given string is a random string, an alert is generated at a particular computing system to which the network communication is directed. Un système informatique est configuré pour entraîner un modèle d'apprentissage machine pour détecter des activités de réseau suspectes sur la base d'un ensemble de données d'apprentissage. L'entrainement du modèle d'apprentissage machine peut être supervisé ou non supervisé. L'ensemble de données d'apprentissage comprend de multiples chaînes. Pour chacune des chaînes multiples, le système informatique extrait une ou plusieurs sous-chaînes de N-grammes, N étant un nombre naturel qui est supérieur ou égal à 2. Le système informatique détermine ensuite une probabilité de chaque sous-chaîne de N-grammes qui peut se produire dans une chaîne. Lorsque le modèle d'apprentissage machine est exécuté, il est configuré pour classer si une chaîne donnée contenue dans une communication réseau est une chaîne aléatoire. En réponse à la classification selon laquelle la chaîne donnée est une chaîne aléatoire, une alerte est générée au niveau d'un système informatique particulier auquel la communication réseau est dirigée.