CHASSISWARTUNG UND MIGRATION IN EINEM SKALIERBAREN NUMA-SYSTEM

Ein Aspekt der Anwendung kann ein System und ein Verfahren zum Ersetzen eines ausgefallenen Knotens durch einen Ersatzknoten in einem System mit ungleichmäßigem Speicherzugriff (NUMA) bereitstellen. Während des Betriebs kann das System als Reaktion auf die Feststellung, dass eine Knotenmigrationsbed...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: McGee, Thomas Edward, Johnson, Brian J, Schumacher, Derek, Woodacre, Michael S, Haden, Stuart C, Dropps, Frank R
Format: Patent
Sprache:ger
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Ein Aspekt der Anwendung kann ein System und ein Verfahren zum Ersetzen eines ausgefallenen Knotens durch einen Ersatzknoten in einem System mit ungleichmäßigem Speicherzugriff (NUMA) bereitstellen. Während des Betriebs kann das System als Reaktion auf die Feststellung, dass eine Knotenmigrationsbedingung erfüllt ist, einen Knotencontroller des Ersatzknotens so initialisieren, dass Zugriffe auf einen lokalen Speicher des Ersatzknotens durch den Knotencontroller zu verarbeiten sind, den ausfallenden Knoten und den Ersatzknoten in den Ruhezustand versetzen, um zu ermöglichen, dass Zustandsinformationen von Prozessoren auf dem ausfallenden Knoten zu Prozessoren auf dem Ersatzknoten migriert werden, und im Anschluss an die Aufhebung des Ruhezustands des ausgefallenen Knotens und des Ersatzknotens Daten von dem ausgefallenen Knoten zu dem Ersatzknoten zu migrieren, während die Cache-Kohärenz in dem NUMA-System aufrechterhalten wird und während das NUMA-System in Betrieb bleibt, wodurch die kontinuierliche Ausführung von Prozessen, die zuvor auf dem ausgefallenen Knoten ausgeführt wurden, erleichtert wird. One aspect of the application can provide a system and method for replacing a failing node with a spare node in a non-uniform memory access (NUMA) system. During operation, in response to determining that a node-migration condition is met, the system can initialize a node controller of the spare node such that accesses to a memory local to the spare node are to be processed by the node controller, quiesce the failing node and the spare node to allow state information of processors on the failing node to be migrated to processors on the spare node, and subsequent to unquiescing the failing node and the spare node, migrate data from the failing node to the spare node while maintaining cache coherence in the NUMA system and while the NUMA system remains in operation, thereby facilitating continuous execution of processes previously executed on the failing node.