IMPROVED TRAINING OF LARGE NEURAL NETWORKS

Methods, systems, and apparatus, including computer programs encoded on computer storage media, for training a neural network to perform any one or more of a variety of machine learning tasks. For example, the neural network can be configured as a generative neural network, e.g., an autoregressive g...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SOHN, Jin Young, FEINBERG, Vladimir, KRIKUN, Maxim, HUANG, Yanping, PETROV, Slav, ANIL, Rohan, CHENG, Yong, XIAO, Kefan, DAI, Andrew M, NADO, Zachary Alexander, MISHRA, Gaurav, ZHANG, Yujing, SHAKERI, Siamak, WU, Yonghui, DU, Nan, LEPIKHIN, Dmitry, CLARK, Jonathan Hudson, GARCIA, Xavier, NI, Eric Jun Jie, XU, Yuanzhong, JOHNSON PREMKUMAR, Melvin Jose, ROY, Aurko, FIRAT, Orhan, SO, David Richard, MOREIRA, Erica Ann
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems, and apparatus, including computer programs encoded on computer storage media, for training a neural network to perform any one or more of a variety of machine learning tasks. For example, the neural network can be configured as a generative neural network, e.g., an autoregressive generative neural network. L'invention concerne des procédés, des systèmes et un appareil, y compris des programmes informatiques codés sur des supports de stockage informatiques, destinés à entraîner un réseau neuronal à effectuer une ou plusieurs tâches parmi une variété de tâches d'apprentissage automatique. Par exemple, le réseau neuronal peut être conçu sous la forme d'un réseau neuronal génératif, p. ex. un réseau neuronal génératif autorégressif.