FUNCTION-AS-A-SERVICE (FAAS) MODEL FOR SPECIALIZED PROCESSING UNITS
A server that includes a graphics processing unit (GPU) may receive, from a first application that is remote from the server, a first request to reserve a first number of cores of the GPU for a first amount of time. The server may also receive, from a second application that is also remote from the...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A server that includes a graphics processing unit (GPU) may receive, from a first application that is remote from the server, a first request to reserve a first number of cores of the GPU for a first amount of time. The server may also receive, from a second application that is also remote from the server, a second request to reserve a second number of cores of the GPU for a second amount of time that at least partly overlaps the first amount of time. The server may determine that the first request is associated with a higher priority than the second request and, in response, may reserve the first number of cores for the first amount of time for the first application. The server may send, to the first application, an indication that the first number of cores have been reserved as requested by the first application.
Selon l'invention, un serveur qui comprend une unité de traitement graphique (GPU) peut recevoir, en provenance d'une première application qui est éloignée du serveur, une première demande visant à réserver un premier nombre de c?urs de la GPU pendant un premier laps de temps. Le serveur peut également recevoir, en provenance d'une seconde application qui est également éloignée du serveur, une seconde demande visant à réserver un second nombre de c?urs de la GPU pendant un second laps de temps qui chevauche au moins partiellement le premier laps de temps. Le serveur peut déterminer que la première demande est associée à une plus haute priorité que la seconde demande et, en réaction, peut réserver le premier nombre de c?urs pendant le premier laps de temps pour la première application. Le serveur peut envoyer, à la première application, une indication selon laquelle le premier nombre de c?urs a été réservé comme demandé par la première application. |
---|