MACHINE LEARNING ASSISTED REMEDIATION OF NETWORKED COMPUTING FAILURE PATTERNS

Disclosed are techniques for automatically determining whether a new disruption of service alert corresponds to a pattern of failures and automatically applying remedies based on the determined pattern. Datasets of historical disruption of service alerts on networked computing clusters are used to t...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MADIRAJU, Mrudula, GANDHI, Deepashree, GOWRI, Shyamala, ARORA, Rakhi S, GABHANE, Jaya H
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Disclosed are techniques for automatically determining whether a new disruption of service alert corresponds to a pattern of failures and automatically applying remedies based on the determined pattern. Datasets of historical disruption of service alerts on networked computing clusters are used to train a machine learning algorithm to identify patterns between alerts. When a new disruption of service alert is received, historical disruption of service alerts for the originating networked computing cluster are also received and provided as input to the machine learning model. The machine learning model then automatically determines whether the new alert fits a pattern with the historical alerts from the same cluster, and when a fit is found, remedial actions are sourced from the alerts that fit the pattern to be applied automatically to the originating networked computing cluster. L'invention concerne des techniques permettant de déterminer automatiquement si une nouvelle alerte d'interruption de service correspond à un motif de défaillances et d'appliquer automatiquement des remèdes sur la base du motif déterminé. Des ensembles de données d'alertes d'interruption de service historiques sur des groupes informatiques en réseau sont utilisés pour entraîner un algorithme d'apprentissage automatique en vue d'identifier des motifs entre des alertes. Lorsqu'une nouvelle alerte d'interruption de service est reçue, des alertes d'interruption de service historiques pour la grappe informatique en réseau d'origine sont également reçues et fournies en tant qu'entrée au modèle d'apprentissage automatique. Le modèle d'apprentissage automatique détermine ensuite automatiquement si la nouvelle alerte correspond à un motif avec les alertes historiques provenant du même groupe et lorsqu'une correspondance est trouvée, des actions correctives sont fournies à partir des alertes qui correspondent au motif pour être appliquées automatiquement au groupe informatique en réseau d'origine.