HIERARCHICAL PARTITIONING OF OPERATORS
Methods and apparatuses for hierarchical partitioning of operators of a neural network for execution on an acceleration engine are provided. Neural networks are built in machine learning frameworks using neural network operators. The neural network operators are compiled into executable code for the...
Gespeichert in:
Hauptverfasser: | , , , , , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Methods and apparatuses for hierarchical partitioning of operators of a neural network for execution on an acceleration engine are provided. Neural networks are built in machine learning frameworks using neural network operators. The neural network operators are compiled into executable code for the acceleration engine. Development of new framework-level operators can exceed the capability to map the newly developed framework-level operators onto the acceleration engine. To enable neural networks to be executed on an acceleration engine, hierarchical partitioning can be used to partition the operators of the neural network. The hierarchical partitioning can identify operators that are supported by a compiler for execution on the acceleration engine, operators to be compiled for execution on a host processor, and operators to be executed on the machine learning framework.
L'invention concerne des procédés et des appareils de partitionnement hiérarchique d'opérateurs d'un réseau de neurones pour une exécution sur un moteur d'accélération. Les réseaux de neurones sont construits dans des architectures d'apprentissage automatique à l'aide d'opérateurs de réseau de neurones. Les opérateurs de réseau de neurones sont compilés en un code exécutable pour le moteur d'accélération. Le développement de nouveaux opérateurs de niveau architecture peut dépasser la capacité à mapper les opérateurs de niveau architecture nouvellement développés sur le moteur d'accélération. Pour permettre à des réseaux de neurones d'être exécutés sur un moteur d'accélération, un partitionnement hiérarchique peut être utilisé pour partitionner les opérateurs du réseau de neurones. Le partitionnement hiérarchique peut identifier des opérateurs qui sont pris en charge par un compilateur pour une exécution sur le moteur d'accélération, des opérateurs à compiler pour une exécution sur un processeur hôte, et des opérateurs à exécuter sur l'architecture d'apprentissage automatique. |
---|