processador de rede neural usando compressão e descompressão de dados de ativação para reduzir utilização de largura de banda de memória

a presente invenção refere-se a um módulo de rede neural profunda ("dnn") que pode comprimir e descomprimir dados de ativação gerados por neurônios para reduzir a utilização de largura de banda de barramento de memória. a unidade de compressão pode receber um bloco não comprimido de dados...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	BENJAMIN ELIOT LUNDELL, CHAD BALLING MCBRIDE, GEORGE PETRE, BORIS BOBROV, JOSEPH LEON CORKERY, LARRY MARVIN WALL, AMOL ASHOK AMBARDEKAR, KENT D. CEDOLA
Format:	Patent
Sprache:	por
Schlagworte:	ALARM SYSTEMS BASIC ELECTRONIC CIRCUITRY CALCULATING CODE CONVERSION IN GENERAL CODING COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS COMPUTING COUNTING DECODING ELECTRIC COMMUNICATION TECHNIQUE ELECTRICITY ORDER TELEGRAPHS PHYSICS SIGNALLING SIGNALLING OR CALLING SYSTEMS TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHICCOMMUNICATION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	a presente invenção refere-se a um módulo de rede neural profunda ("dnn") que pode comprimir e descomprimir dados de ativação gerados por neurônios para reduzir a utilização de largura de banda de barramento de memória. a unidade de compressão pode receber um bloco não comprimido de dados gerados por um neurônio no módulo dnn. a unidade de compressão gera uma parte de máscara e uma parte de dados de um bloco de saída comprimido. a parte de máscara codifica a presença e localização dos bytes de zeros e de não zeros no bloco não comprimido de dados. a parte de dados armazena bytes de não zeros truncados do bloco não comprimido de dados. uma unidade de descompressão pode receber um bloco comprimido de dados de memória no processador dnn ou de memória de um hospedeiro de aplicações. a unidade de descompressão descomprime o bloco comprimido de dados usando a parte de máscara e a parte de dados. isto pode reduzir utilização de barramento de memória, permitir que um módulo dnn complete operações de processamento mais rapidamente e reduzir consumo de energia. A deep neural network ("DNN") module compresses and decompresses neuron-generated activation data to reduce the utilization of memory bus bandwidth. The compression unit receives an uncompressed chunk of data generated by a neuron in the DNN module. The compression unit generates a mask portion and a data portion of a compressed output chunk. The mask portion encodes the presence and location of the zero and non-zero bytes in the uncompressed chunk of data. The data portion stores truncated non-zero bytes from the uncompressed chunk of data. A decompression unit receives a compressed chunk of data from memory in the DNN processor or memory of an application host. The decompression unit decompresses the compressed chunk of data using the mask portion and the data portion.