MULTI-CORE COMMUNICATION ACCELERATION USING HARDWARE QUEUE DEVICE

Apparatus and methods implementing a hardware queue management device for reducing inter-core data transfer overhead by offloading request management and data coherency tasks from the CPU cores. The apparatus include multi-core processors, a shared L3 or last-level cache ("LLC"), and a har...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MA, Te K, VANGATI, Narender, VAN DOREN, Stephen R, BURRES, Bradley A, WANG, Ren, MCDONNELL, Niall D, SONNIER, David, BERNSTEIN, Debra, WANG, Yipeng, VENKATESAN, Namakkal N, VERPLANKE, Edwin, CUNNINGHAM, Andrew, EADS, Gage, YAN, An, TSAI, Jr-Shian, CLEE, James T, HERDRICH, Andrew J, WHITESELL, Jamison D, KENNY, Jonathan, TAI, Tsung-Yuan C, MILLER, Stephen, WILKINSON, Hugh, BURROUGHS, William, RICHARDSON, Bruce, HASTING, Joseph R, PIROG, Jerry
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Apparatus and methods implementing a hardware queue management device for reducing inter-core data transfer overhead by offloading request management and data coherency tasks from the CPU cores. The apparatus include multi-core processors, a shared L3 or last-level cache ("LLC"), and a hardware queue management device to receive, store, and process inter-core data transfer requests. The hardware queue management device further comprises a resource management system to control the rate in which the cores may submit requests to reduce core stalls and dropped requests. Additionally, software instructions are introduced to optimize communication between the cores and the queue management device. L'invention concerne un appareil et des procédés pour mettre en œuvre un dispositif de gestion de file d'attente matérielle pour réduire un surdébit de transfert de données inter-cœurs par délestage de tâches de gestion de requête et de cohérence de données à partir des cœurs d'unité centrale de traitement (CPU). L'appareil comprend des processeurs multicœur, une mémoire cache L3 ou de dernier niveau (« LLC ») partagée, et un dispositif de gestion de file d'attente matérielle pour recevoir, stocker et traiter des requêtes de transfert de données inter-cœurs. Le dispositif de gestion de file d'attente matérielle comprend en outre un système de gestion de ressource pour commander le débit avec lequel les cœurs peuvent soumettre des requêtes pour réduire les blocages de cœur et les requêtes abandonnées. En outre, des instructions logicielles sont introduites pour optimiser la communication entre les cœurs et le dispositif de gestion de file d'attente.