APPARATUS AND METHOD FOR MEMORY-HIERARCHY AWARE PRODUCER-CONSUMER INSTRUCTION

An apparatus and method are described for efficiently transferring data from a core of a central processing unit (CPU) to a graphics processing unit (GPU). For example, one embodiment of a method comprises: writing data to a buffer within the core of the CPU until a designated amount of data has bee...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MANDELBLAT, JULIUS YULI, NOVAKOVSKY, LARISA, RAIKIN, SHLOMO, VALENTINE, ROBERT, SADE, RAANAN, SHALEV, RON
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:An apparatus and method are described for efficiently transferring data from a core of a central processing unit (CPU) to a graphics processing unit (GPU). For example, one embodiment of a method comprises: writing data to a buffer within the core of the CPU until a designated amount of data has been written; upon detecting that the designated amount of data has been written, responsively generating an eviction cycle, the eviction cycle causing the data to be transferred from the buffer to a cache accessible by both the core and the GPU; setting an indication to indicate to the GPU that data is available in the cache; and upon the GPU detecting the indication, providing the data to the GPU from the cache upon receipt of a read signal from the GPU. La présente invention concerne un appareil et un procédé destinés à transférer des données de manière efficace d'un coeur d'une unité centrale de traitement (UC) à une unité de traitement graphique (GPU). Par exemple, un mode de réalisation d'un procédé selon l'invention consiste à : écrire des données dans une mémoire tampon au sein du coeur de l'UC jusqu'à ce qu'une quantité prédéfinie de données ait été écrite ; après détection de l'écriture de la quantité prédéfinie de données, générer en réponse un cycle d'éviction, le cycle d'éviction permettant de transférer les données de la mémoire tampon vers une mémoire cache accessible à la fois par le coeur et la GPU ; définir une indication pour indiquer à la GPU que les données sont disponibles dans la mémoire cache ; et après détection de l'indication par la GPU, fournir les données à la GPU à partir de la mémoire cache dès la réception d'un signal de lecture provenant de la GPU.