TRAINING A NEURAL NETWORK USING STOCHASTIC WHITENING BATCH NORMALIZATION
A neural network system, comprising: instructions for implementing at least a SWBN layer in a neural network, and wherein the instructions perform operations comprising: during training of the neural network system on a plurality of batches of training data and for each of the plurality of batches:...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A neural network system, comprising: instructions for implementing at least a SWBN layer in a neural network, and wherein the instructions perform operations comprising: during training of the neural network system on a plurality of batches of training data and for each of the plurality of batches: obtaining a respective first layer output for each of the plurality of training data; determining a plurality of normalization statistics for the batch from the first layer outputs; generating a respective normalized output for each training data in the batch; updating the whitening matrix by a covariance matrix; performing stochastic whitening on the normalized components of each first layer output; transforming the whitened data for each training data; generating a respective SWBN layer output for each of the training data from the transformed whitened data for each training data in the batch; and providing the SWBN layer output.
Système de réseau neuronal, comprenant : des instructions destinées à mettre en œuvre au moins une couche SWBN dans un réseau neuronal, et les instructions effectuant des opérations consistant : pendant la formation du système de réseau neuronal sur une pluralité de lots de données de formation et pour chaque lot de la pluralité de lots : à obtenir une première sortie de couche respective pour chaque donnée de formation de la pluralité de données de formation ; à déterminer une pluralité de statistiques de normalisation correspondant au lot à partir des sorties de première couche ; à générer une sortie normalisée respective pour chaque donnée de formation dans le lot ; à mettre à jour la matrice de blanchiment par une matrice de covariance ; à transformer les données de blanchiment pour chaque donnée de formation ; à générer une sortie de couche SWBN respective pour chacune des données de formation à partir des données de blanchiment transformées pour chaque donnée de formation dans le lot ; et à fournir la sortie de la couche SWBN. |
---|