PERFORMING NAVIGATION TASKS USING GRID CODES

Methods, systems, and apparatus, including computer programs encoded on a computer storage medium, for selecting actions to be performed by an agent interacting with an environment. In one aspect, a system comprises a grid cell neural network and an action selection neural network. The grid cell net...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HADSELL, Raia Thais, BANINO, Andrea, KUMARAN, Sudarshan, URIA-MARTINEZ, Benigno
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems, and apparatus, including computer programs encoded on a computer storage medium, for selecting actions to be performed by an agent interacting with an environment. In one aspect, a system comprises a grid cell neural network and an action selection neural network. The grid cell network is configured to: receive an input comprising data characterizing a velocity of the agent; process the input to generate a grid cell representation; and process the grid cell representation to generate an estimate of a position of the agent in the environment; the action selection neural network is configured to: receive an input comprising a grid cell representation and an observation characterizing a state of the environment; and process the input to generate an action selection network output. L'invention concerne des procédés, des systèmes et un appareil, y compris des programmes informatiques codés sur un support de stockage informatique, permettant de sélectionner des actions devant être réalisées par un agent interagissant avec un environnement. Selon un aspect, un système comprend un réseau neuronal de cellules de grille et un réseau neuronal de sélection d'action. Le réseau de cellules de grille est configuré pour : recevoir une entrée comprenant des données caractérisant une vitesse de l'agent ; traiter l'entrée pour générer une représentation de cellule de grille ; et traiter la représentation de cellule de grille pour générer une estimation d'une position de l'agent dans l'environnement. Le réseau neuronal de sélection d'action est configuré pour : recevoir une entrée comprenant une représentation d'une cellule de grille et une observation caractérisant un état de l'environnement ; et traiter l'entrée pour générer une sortie du réseau de sélection d'action.