COMPILING CODE FOR A MACHINE LEARNING MODEL FOR EXECUTION ON A SPECIALIZED PROCESSOR
The subject technology receives a neural network model in a model format, the model format including information for a set of layers of the neural network model, each layer of the set of layers including a set of respective operations. The subject technology generates neural network (NN) code from t...
Gespeichert in:
Hauptverfasser: | , , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The subject technology receives a neural network model in a model format, the model format including information for a set of layers of the neural network model, each layer of the set of layers including a set of respective operations. The subject technology generates neural network (NN) code from the neural network model, the NN code being in a programming language distinct from the model format, and the NN code comprising a respective memory allocation for each respective layer of the set of layers of the neural network model, where the generating comprises determining the respective memory allocation for each respective layer based at least in part on a resource constraint of a target device. The subject technology compiles the NN code into a binary format. The subject technology generates a package for deploying the compiled NN code on the target device.
La technologie de l'invention concerne la réception d'un modèle de réseau neuronal dans un format de modèle, le format de modèle comprenant des informations pour un ensemble de couches du modèle de réseau neuronal, chaque couche de l'ensemble de couches comprenant un ensemble d'opérations respectives. La technologie de l'invention génère un code de réseau neuronal (NN) à partir du modèle de réseau neuronal, le code NN étant dans un langage de programmation distinct du format de modèle, et le code NN comprenant une attribution de mémoire respective pour chaque couche respective de l'ensemble de couches du modèle de réseau neuronal, la génération consistant à déterminer l'attribution de mémoire respective pour chaque couche respective en fonction, au moins en partie, d'une contrainte de ressource d'un dispositif cible. La technologie du sujet compile le code NN en un format binaire. La technologie de sujet génère un paquet permettant de déployer le code NN compilé sur le dispositif cible. |
---|