Auslagern der Kernel-Ausführung zu der Grafik

Die Ausführung eines ersten Kernels kann unter Verwendung eines Ringaufgabenpuffers mit einer festen Anzahl von Schlitzen von einer zentralen Verarbeitungseinheit zu einer Grafikverarbeitungseinheit ausgelagert werden, was einen vollständigen Aufwand der Laufzeittreiberwechselwirkung verursacht. Bei...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Bobrovsky, Konstantin S, Ermolaev, Sergey N, Dimitriev, Serguei N, Kirkegaard, Knud J
Format: Patent
Sprache:ger
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Die Ausführung eines ersten Kernels kann unter Verwendung eines Ringaufgabenpuffers mit einer festen Anzahl von Schlitzen von einer zentralen Verarbeitungseinheit zu einer Grafikverarbeitungseinheit ausgelagert werden, was einen vollständigen Aufwand der Laufzeittreiberwechselwirkung verursacht. Bei einigen Ausführungsformen wird die Ausführung eines zweiten Kernels unter Verwendung des Ringaufgabenpuffers ausgelagert, so dass wenigstens zwei Kernels unter Verwendung des Ringaufgabenpuffers von einer zentralen Verarbeitungseinheit zu einer Grafikverarbeitungseinheit ausgelagert werden können, während etwa der gleiche Auslagerungsaufwand verursacht wird, wie durch das Auslagern eines einzelnen Kernels verursacht würde. Mehrere Kernels werden durch einen Kompilierer und einen Linker automatisch zusammengefasst. Execution of a first kernel may be offloaded from a central processing unit to a graphics processing unit using a ring task buffer with a fixed number of task slots incurring full overhead of runtime driver interaction. Execution of a second kernel is offloaded using said ring task buffer, so at least two kernels may be offloaded from a central processing unit to a graphics processing unit via said ring task buffer, while incurring about the same offloading overhead as would be incurred from offloading a single kernel, in some embodiments. Multiple kernels are automatically grouped together by a compiler and linker.