AGENT CONTROL USING TOKEN-BASED DYNAMICS MODELS

Methods, systems, and apparatus, including computer programs encoded on a computer storage medium, for controlling agents using sequence-processing neural networks. In particular, the sequence-processing neural network is used as a dynamics model of the environment in order to perform planning when...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ZHANG, Jingwei, SCHUBERT, Ingmar Fabian, PARISOTTO, Emilio, HEESS, Nicolas Manfred Otto, BECHTLE, Sarah Maria Elisabeth, HASENCLEVER, Leonard, BYRAVAN, Arunkumar, SPRINGENBERG, Jost Tobias
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems, and apparatus, including computer programs encoded on a computer storage medium, for controlling agents using sequence-processing neural networks. In particular, the sequence-processing neural network is used as a dynamics model of the environment in order to perform planning when selecting actions to be performed by an agent. L'invention concerne des procédés, des systèmes et un appareil, y compris des programmes d'ordinateur codés sur un support de stockage d'ordinateur, pour commander des agents à l'aide de réseaux neuronaux de traitement de séquence. En particulier, le réseau neuronal de traitement de séquence est utilisé en tant que modèle dynamique de l'environnement afin d'effectuer une planification lors de la sélection d'actions à effectuer par un agent.