MODEL COMPRESSION VIA QUANTIZED SPARSE PRINCIPAL COMPONENT ANALYSIS

A processor-implemented method includes retrieving, for a layer of a set of layers of an artificial neural network (ANN), a dense quantized matrix representing a codebook and a sparse quantized matrix representing linear coefficients. The dense quantized matrix and the sparse quantized matrix may be...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: NAGEL, Markus, BEHBOODI, Arash, VAN BAALEN, Marinus Willem, KUZMIN, Andrey
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A processor-implemented method includes retrieving, for a layer of a set of layers of an artificial neural network (ANN), a dense quantized matrix representing a codebook and a sparse quantized matrix representing linear coefficients. The dense quantized matrix and the sparse quantized matrix may be associated with a weight tensor of the layer. The processor-implemented method also includes determining, for the layer of the set of layers, the weight tensor based on a product of the dense quantized matrix and the sparse quantized matrix. The processor-implemented method further includes processing, at the layer, an input based on the weight tensor. Un procédé mis en œuvre par processeur comprend la récupération, pour une couche d'un ensemble de couches d'un réseau de neurones artificiels (ANN), d'une matrice quantifiée dense représentant un livre de codes et d'une matrice quantifiée creuse représentant des coefficients linéaires. La matrice quantifiée dense et la matrice quantifiée creuse peuvent être associées à un tenseur de poids de la couche. Le procédé mis en œuvre par processeur comprend également la détermination, pour la couche de l'ensemble de couches, du tenseur de poids sur la base d'un produit de la matrice quantifiée dense et de la matrice quantifiée creuse. Le procédé mis en œuvre par processeur comprend en outre le traitement, au niveau de la couche, d'une entrée sur la base du tenseur de poids.