DETECTING AND MITIGATING CROSS-LAYER IMPACT OF CHANGE EVENTS ON A CLOUD COMPUTING SYSTEM
The present disclosure relates to systems, methods, and computer-readable media for identifying anomalies of failure events on a cloud computing system and determining cross-component and cross-layer correlation between change events that occur on the cloud computing system and the failure events as...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The present disclosure relates to systems, methods, and computer-readable media for identifying anomalies of failure events on a cloud computing system and determining cross-component and cross-layer correlation between change events that occur on the cloud computing system and the failure events associated with the anomalies. In particular, this disclosure describes a system that receives telemetry related to change events and failure events across any number of computing layers of a distributed computing environment (e.g., a cloud computing system) and detects anomalies based on counts of failure events that are manifested over discrete periods of time. Based on these detected anomalies, the anomaly correlation system can determine cross-layer and cross-component correlations between selective change events and the detected anomalies of failure events. The anomaly correlation system may further generate and provide recommendations related to mitigating or otherwise addressing the anomalies based on the determined correlations.
La présente divulgation concerne des systèmes, des procédés et des supports lisibles par ordinateur pour identifier des anomalies d'événements de défaillance sur un système informatique en nuage, et déterminer une corrélation inter-composants et une corrélation inter-couches entre des événements de changement qui se produisent sur le système informatique en nuage et les événements de défaillance associés aux anomalies. En particulier, la divulgation décrit un système qui reçoit des données de télémesure liées à des événements de changement et à des événements de défaillance sur un nombre quelconque de couches informatiques d'un environnement informatique distribué (par exemple, un système informatique en nuage), et détecte des anomalies sur la base de nombres d'événements de défaillance qui se manifestent sur des périodes de temps discrètes. Sur la base de ces anomalies détectées, le système de corrélation d'anomalies peut déterminer des corrélations inter-couches et des corrélations inter-composantes entre des événements de changement sélectifs et les anomalies détectées d'événements de défaillance. Le système de corrélation d'anomalies peut en outre générer et fournir des recommandations relatives à l'atténuation ou à l'adressage des anomalies, sur la base des corrélations déterminées. |
---|