METHOD AND SYSTEM FOR SEARCHING DEEP NEURAL NETWORK ARCHITECTURE
Provided is a method for searching a deep neural network architecture for the computation offloading in a computing environment performing computation by using a first device and a second device. The method for searching a deep neural network architecture comprises: a step of configuring a target de...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Provided is a method for searching a deep neural network architecture for the computation offloading in a computing environment performing computation by using a first device and a second device. The method for searching a deep neural network architecture comprises: a step of configuring a target deep network including a plurality of computation cells, in which each of the computation cells includes: a plurality of nodes; a weight value between the plurality of nodes; and a computation selector selecting one of candidate computations between the plurality of nodes; a step of dividing the plurality of computation cells into a first part where the computation is conducted on a first device and a second part where the computation is conducted on a second device, in which the first part includes a transmission cell which includes: a resource selector determining whether each computation in the transmission cell would be processed on the first device or the second device; and a channel selector determining the channel to transmit the computation result processed on the first device to the second device; and a step of updating the weight value, the computation selector, the resource selector, and the channel selector. Therefore, a short delay time and a high communication efficiency can be achieved at the same time.
제1 기기와 제2 기기를 이용하여 연산을 수행하는 컴퓨팅 환경에서 연산 오프로딩을 위한 심층 신경망 구조 탐색 방법이 제공된다. 심층 신경망 구조 탐색 방법은, 복수의 연산 셀을 포함하는 타겟 딥네트워크(deep network)를 구성하되, 각각의 연산 셀은, 복수의 노드와, 복수의 노드의 각 노드 사이의 가중치와, 복수의 노드의 각 노드 사이의 후보 연산 중 하나를 선택하는 연산 선택기를 포함하고, 복수의 연산 셀을 제1 기기에서 연산이 수행되는 제1 부분과 제2 기기에서 연산이 수행되는 제2 부분으로 분할하되, 제1 부분은 전송 셀을 포함하고, 전송 셀은, 전송 셀 내부의 각각의 연산들이 제1 기기에서 치리될지 아니면 제2 기기에서 처리될지를 결정하는 자원 선택기와, 제1 기기에서 처리된 연산 결과를 제2 기기로 전송하는 채널을 결정하는 채널 선택기를 포함하고, 가중치, 연산 선택기, 자원 선택기 및 채널 선택기를 업데이트하는 것을 포함한다. |
---|