TRANSPARENT FAULT TOLERANT COMPUTER SYSTEM

In a fault-tolerant computer system, a primary replica supervisor is interposed between an operating system and a primary replica of an application program being executed by a primary processor. An object-code editor locates calls to the operating system and loops in the application program and inse...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: AHERN, JOHN, E, SCHNEIDER, FRED, B, BIRMAN, KENNETH, P, BRESSOUD, THOMAS, C, GLADE, BRADFORD, B, SERVICE, JOHN, D, COOPER, ROBERT, C., B
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:In a fault-tolerant computer system, a primary replica supervisor is interposed between an operating system and a primary replica of an application program being executed by a primary processor. An object-code editor locates calls to the operating system and loops in the application program and inserts instruction sequences that enable the replica supervisor to intercept the calls to the operating system, results returned by the operating system as a result of the calls and asynchronous events delivered by the operating system to the replica. A backup replica supervisor is similarly interposed between an operating system and a backup replica of the application program being executed by a backup processor. The primary replica interacts with an environment. The replica supervisors ensure that the backup replica undergoes state transformations, as a result of the calls to the operating system and asynchronous events, that are equivalent to state transformations that the primary replica undergoes as a result of corresponding calls and asynchronous events. Thus, after a failure in the primary processor, the backup replica can interact with the environment in a manner consistent with interactions between the primary replica and the environment prior to the failure. Dans un système informatique à tolérance de panne, un superviseur de répliques primaires est interposé entre un système d'exploitation et une réplique primaire de logiciel d'application en cours d'exécution par un processeur primaire. Un éditeur de code objet adresse des appels au système d'exploitation et aux boucles du logiciel d'application, puis insère des séquences d'instructions qui permettent au superviseur de répliques d'intercepter les appels au système d'exploitation, et d'intercepter les résultats renvoyés par le système d'exploitation en réponse aux appels et événements asynchrones adressés à la réplique par le système d'application. De la même façon, un superviseur de répliques de secours est interposé entre un système d'exploitation et une réplique de secours du logiciel d'application en cours d'exécution par un processeur de secours. La réplique primaire est en interaction avec un environnement. Les superviseurs de répliques garantissent que la réplique de secours subit les transformations d'états en réaction aux appels adressés au système d'exploitation et en réaction aux événements asynchrones, ce qui est l'équivalent des transformations d'états que la réplique primaire subit à la sui