PROCEDE DE GESTION DE PANNE DANS UN RESEAU DE NOEUDS BASE SUR UNE STRATEGIE LOCALE

L'invention concerne un procédé de gestion de panne dans un réseau de nœuds (21-63), comprenant, pour chaque nœud considéré de tout ou partie des nœuds (21-53) du réseau effectuant un même calcul : d'abord, une étape de sauvegarde locale de l'état de ce nœud considéré (21-53), au nive...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: GERMAIN, FLORENT, LESNICKI, PIOTR, LEPOUTERE, GUILLAUME, BRELLE, EMMANUEL
Format: Patent
Sprache:fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:L'invention concerne un procédé de gestion de panne dans un réseau de nœuds (21-63), comprenant, pour chaque nœud considéré de tout ou partie des nœuds (21-53) du réseau effectuant un même calcul : d'abord, une étape de sauvegarde locale de l'état de ce nœud considéré (21-53), au niveau d'un support de stockage (31-56) de ce nœud considéré (21-53), le lien entre ce support de stockage (31-56) et ce nœud considéré (21-53) pouvant être redirigé de ce support de stockage (31-56) vers un autre nœud (21-63), ensuite, si le nœud considéré est défaillant (21, 42), une étape de récupération de la sauvegarde locale de l'état de ce nœud considéré (21, 42), en redirigeant ledit lien entre le nœud considéré (21, 42) et son support de stockage (31, 45) de manière à relier ledit support de stockage (31, 45) vers un nœud opérationnel (23, 43) différent du nœud considéré (21, 42), ce nœud opérationnel (23, 43) étant déjà en train d'effectuer ledit calcul, les sauvegardes locales de ces nœuds considérés (21-53), utilisées pour les étapes de récupération, sont cohérentes entre elles de sorte à correspondre à un même état de ce calcul, puis, si au moins un nœud considéré est défaillant (21, 42), une étape de renvoi de ladite sauvegarde locale de ce nœud considéré (21, 42) vers un nouveau nœud supplémentaire (61-63) rajouté audit réseau à l'occasion de la défaillance de ce nœud considéré (21, 42). Disclosed is a failure management method in a network of nodes, including, for each considered node: first, a step of locally saving the state of this considered node, to a storage medium for this node in question. Then, if the considered node has failed, retrieving the local backup of the state of this considered node, by redirecting the link between the considered node and its storage medium to connect this storage medium to an operational node other than the considered node, this operational node already in the process of carrying out this calculation, the local backups of these considered nodes, used for the retrieving steps being coherent with each other so as to correspond to the same state of calculation. If a considered node failed, returning this local backup for this considered node to a new additional node added to the network at the time of the failure.