METHOD AND DEVICE OF COMPUTING LAYOUT SELECTION FOR EFFICIENT DNN INFERENCE
Embodiments herein provide a method and system for network and hardware aware computing layout selection for efficient Deep Neural Network (DNN) Inference. The method comprises receiving, by the electronic device (100), a DNN model to be executed, wherein the DNN model is associated with a task; div...
Gespeichert in:
Hauptverfasser: | , , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Embodiments herein provide a method and system for network and hardware aware computing layout selection for efficient Deep Neural Network (DNN) Inference. The method comprises receiving, by the electronic device (100), a DNN model to be executed, wherein the DNN model is associated with a task; dividing the DNN model into a plurality of sub-graphs, wherein each sub-graph is to be processed individually; identifying a computing unit from a plurality of computing units for execution of each sub-graph based on a complexity score; and determining a computing layout from a plurality of computing layouts for each identified computing unit, wherein the sub-graph is executed on the identified computing unit through the determined computing layout.
Des modes de réalisation de la présente invention concernent un procédé et un système pour une sélection de disposition informatique sensible au réseau et au matériel pour une inférence de réseau neuronal profond (DNN) efficace. Le procédé comprend la réception, par le dispositif électronique (100), d'un modèle DNN à exécuter, le modèle DNN étant associé à une tâche ; la division du modèle DNN en une pluralité de sous-graphes, chaque sous-graphe devant être traité individuellement ; l'identification d'une unité informatique à partir d'une pluralité d'unités informatiques pour l'exécution de chaque sous-graphe sur la base d'un score de complexité ; et la détermination d'une disposition informatique à partir d'une pluralité de dispositions informatiques pour chaque unité informatique identifiée, le sous-graphe étant exécuté sur l'unité informatique identifiée par l'intermédiaire de la disposition informatique déterminée. |
---|