METHOD OF ARTIFICIAL NEURAL NETWORK QUANTIZATION AND METHOD OF COMPUTATION USING ARTIFICIAL NEURAL NETWORK

According to a technical idea of the present disclosure, a computing system comprises a neural network system for driving an artificial neural network and a quantization system for quantizing the artificial neural network. The quantization system can quantize parameters of an artificial neural netwo...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KIM KYOUNG YOUNG, PARK JU HEE, HA SANG HYUCK
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:According to a technical idea of the present disclosure, a computing system comprises a neural network system for driving an artificial neural network and a quantization system for quantizing the artificial neural network. The quantization system can quantize parameters of an artificial neural network to generate quantized parameters of the artificial neural network, generate a quantization error of parameters of the artificial neural network based on the parameters of the artificial neural network and the quantized parameters, generate a correction bias based on the quantized parameters and the quantization error of the parameters of the artificial neural network, and transmit the generated quantized parameters and the correction bias to the neural network system. 본 개시의 기술적 사상에 따른 컴퓨팅 시스템은, 인공 신경망을 구동하는 신경망 시스템 및 인공 신경망을 양자화하는 양자화 시스템을 포함하고, 양자화 시스템은, 인공 신경망의 파라미터들을 양자화함으로써, 인공 신경망의 양자화된 파라미터들을 생성하고, 인공 신경망의 파라미터들 및 양자화된 파라미터들을 기초로 인공 신경망의 파라미터들의 양자화 오차를 생성하고, 양자화된 파라미터들 및 인공 신경망의 파라미터들의 양자화 오차를 기초로 보정 바이어스를 생성하고, 생성한 양자화된 파라미터들 및 보정 바이어스를 신경망 시스템에 전송할 수 있다.