COORDINATING FAULT RECOVERY IN A DISTRIBUTED SYSTEM
In various embodiments, methods and systems for coordinating, between a host and a tenant, fault recovery of tenant infrastructure in a distributed system is provided. A fault occurrence is determined for a tenant infrastructure in the distributed system. The fault occurrence may be a software failu...
Gespeichert in:
Hauptverfasser: | , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | In various embodiments, methods and systems for coordinating, between a host and a tenant, fault recovery of tenant infrastructure in a distributed system is provided. A fault occurrence is determined for a tenant infrastructure in the distributed system. The fault occurrence may be a software failure or hardware failure of the tenant infrastructure supporting a service application of the tenant. A fault recovery plan is communicated to the tenant to notify the tenant of the fault occurrence and actions taken to restore the tenant infrastructure. It is determined whether a fault recovery plan response is received from the tenant; the fault recovery plan response is an acknowledgement from the tenant of the fault recovery plan. Upon receiving the fault recovery plan response or at the expiration of a predefined time limit, the fault recovery plan is executed to restore the tenant infrastructure.
L'invention concerne différents modes de réalisation, procédés et systèmes servant à coordonner, entre un hôte et un exploitant, la correction des défauts apparaissant dans l'infrastructure d'un exploitant au sein d'un système distribué. On détermine l'apparition d'un défaut concernant l'infrastructure d'un exploitant dans le système distribué. L'apparition du défaut peut consister en une défaillance logicielle ou une défaillance matérielle de l'infrastructure de l'exploitant supportant une application de service de l'exploitant. On communique un plan de correction de défaut à l'exploitant pour informer ce dernier de l'apparition du défaut et on prend des actions pour rétablir la bonne marche de l'infrastructure de l'exploitant. On détermine si une réponse au plan de correction de défaut a été reçue de l'exploitant ; la réponse au plan de correction de défaut est un accusé de réception, de la part de l'exploitant, du plan de correction de défaut. Lors de la réception de la réponse au plan de correction de défaut ou en cas d'expiration d'une limite de temps prédéfinie, on exécute le plan de correction de défaut pour rétablir la bonne marche de l'infrastructure de l'exploitant. |
---|