EXPANDED NEURAL NETWORK TRAINING LAYERS FOR CONVOLUTION
A computer model is trained with an architecture including additional training layers relative to the inference architecture. The architecture of a computer model to be used in inference includes a convolutional layer with a number of K × K convolutional filters. For training, the convolutional filt...
Gespeichert in:
Hauptverfasser: | , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A computer model is trained with an architecture including additional training layers relative to the inference architecture. The architecture of a computer model to be used in inference includes a convolutional layer with a number of K × K convolutional filters. For training, the convolutional filters are expanded to a plurality of training layers including a layer with 1 × 1 and K × K filters. The expanded layers may include additional layers than the number of expanded filters in the layer of the inference model. The 1 × 1 expanded layer in training may learn weights for combining the K × K expanded layers, providing a weighted combination of the K ×K filters for the respective channel of the layer of the inference layer.
Un modèle informatique est entraîné avec une architecture comprenant des couches d'apprentissage supplémentaires par rapport à l'architecture d'inférence. L'architecture d'un modèle informatique à utiliser dans l'inférence comprend une couche de convolution avec un nombre de K × K filtres convolutifs. Pour l'apprentissage, les filtres convolutifs sont étendus à une pluralité de couches d'apprentissage comprenant une couche de 1 × 1 et K × K filtres. Les couches étendues peuvent comprendre des couches supplémentaires que le nombre de filtres étendus dans la couche du modèle d'inférence. La couche étendue 1 × 1 lors de l'apprentissage peut apprendre des pondérations pour combiner les K × K couches étendues, permettant une combinaison pondérée des K × K filtres pour le canal respectif de la couche de la couche d'inférence. |
---|