TRAINING A NEURAL NETWORK USING STOCHASTIC WHITENING BATCH NORMALIZATION

A neural network system, comprising: instructions for implementing at least a SWBN layer in a neural network, and wherein the instructions perform operations comprising: during training of the neural network system on a plurality of batches of training data and for each of the plurality of batches:...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: FASHANDI, Homa, NEZHADARYA, Ehsan, ZHANG, Shengdong, LIU, Jiayi
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A neural network system, comprising: instructions for implementing at least a SWBN layer in a neural network, and wherein the instructions perform operations comprising: during training of the neural network system on a plurality of batches of training data and for each of the plurality of batches: obtaining a respective first layer output for each of the plurality of training data; determining a plurality of normalization statistics for the batch from the first layer outputs; generating a respective normalized output for each training data in the batch; updating the whitening matrix by a covariance matrix; performing stochastic whitening on the normalized components of each first layer output; transforming the whitened data for each training data; generating a respective SWBN layer output for each of the training data from the transformed whitened data for each training data in the batch; and providing the SWBN layer output. Système de réseau neuronal, comprenant : des instructions destinées à mettre en œuvre au moins une couche SWBN dans un réseau neuronal, et les instructions effectuant des opérations consistant : pendant la formation du système de réseau neuronal sur une pluralité de lots de données de formation et pour chaque lot de la pluralité de lots : à obtenir une première sortie de couche respective pour chaque donnée de formation de la pluralité de données de formation ; à déterminer une pluralité de statistiques de normalisation correspondant au lot à partir des sorties de première couche ; à générer une sortie normalisée respective pour chaque donnée de formation dans le lot ; à mettre à jour la matrice de blanchiment par une matrice de covariance ; à transformer les données de blanchiment pour chaque donnée de formation ; à générer une sortie de couche SWBN respective pour chacune des données de formation à partir des données de blanchiment transformées pour chaque donnée de formation dans le lot ; et à fournir la sortie de la couche SWBN.