METHOD AND DEVICE OF COMPUTING LAYOUT SELECTION FOR EFFICIENT DNN INFERENCE

Embodiments herein provide a method and system for network and hardware aware computing layout selection for efficient Deep Neural Network (DNN) Inference. The method comprises receiving, by the electronic device (100), a DNN model to be executed, wherein the DNN model is associated with a task; div...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: UDUPA SHANKARANARAYANA GOPAL, Amogha, DWIVEDI, Aniket, KUDRAL, Suhas Parlathaya, SENAPATI, Alladi Ashok Kumar, ABRAHAM, Arun, SINGH, Briraj, MUDRAGADA, Bharat, NAIDU, Praveen Doreswamy
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Embodiments herein provide a method and system for network and hardware aware computing layout selection for efficient Deep Neural Network (DNN) Inference. The method comprises receiving, by the electronic device (100), a DNN model to be executed, wherein the DNN model is associated with a task; dividing the DNN model into a plurality of sub-graphs, wherein each sub-graph is to be processed individually; identifying a computing unit from a plurality of computing units for execution of each sub-graph based on a complexity score; and determining a computing layout from a plurality of computing layouts for each identified computing unit, wherein the sub-graph is executed on the identified computing unit through the determined computing layout. Des modes de réalisation de la présente invention concernent un procédé et un système pour une sélection de disposition informatique sensible au réseau et au matériel pour une inférence de réseau neuronal profond (DNN) efficace. Le procédé comprend la réception, par le dispositif électronique (100), d'un modèle DNN à exécuter, le modèle DNN étant associé à une tâche ; la division du modèle DNN en une pluralité de sous-graphes, chaque sous-graphe devant être traité individuellement ; l'identification d'une unité informatique à partir d'une pluralité d'unités informatiques pour l'exécution de chaque sous-graphe sur la base d'un score de complexité ; et la détermination d'une disposition informatique à partir d'une pluralité de dispositions informatiques pour chaque unité informatique identifiée, le sous-graphe étant exécuté sur l'unité informatique identifiée par l'intermédiaire de la disposition informatique déterminée.