METHOD AND APPARATUS FOR PROCESSING NEURAL NETWORK OPERATION
Provided are a device and method for processing a neural network calculation. According to one embodiment, the method thereof comprises the steps of: obtaining a first weight kernel of a weight model and the pruning information of the first weight kernel; specifying a processing range corresponding...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Provided are a device and method for processing a neural network calculation. According to one embodiment, the method thereof comprises the steps of: obtaining a first weight kernel of a weight model and the pruning information of the first weight kernel; specifying a processing range corresponding to each weight element vector of the first weight kernel in an input feature map based on the pruning information; performing a convolution calculation between the input feature map and the first weight kernel based on the specified processing range; and generating an output feature map based on the calculation result of the convolution calculation.
뉴럴 네트워크 연산 처리 장치 및 방법이 제공된다. 일 실시예에 따르면, 그 방법은 웨이트 모델의 제1 웨이트 커널 및 제1 웨이트 커널의 프루닝 정보를 획득하고, 프루닝 정보에 기초하여 입력 특징 맵에서 제1 웨이트 커널의 각 웨이트 엘리먼트 벡터에 대응하는 처리 범위를 특정하고, 특정된 처리 범위에 기초하여 입력 특징 맵과 제1 웨이트 커널 간의 컨볼루션 연산을 수행하고, 컨볼루션 연산의 연산 결과에 기초하여 출력 특징 맵을 생성하는 단계들을 포함한다. |
---|