INTERACTIVE AGENT

In various examples there is a method performed by a computer-implemented agent in an environment. The method comprises storing a reinforcement learning policy for controlling the computer-implemented agent. The method also comprises storing a distribution as a latent representation of a belief of t...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ZINTGRAF, Luisa, HOFMANN, Katja, CIOSEK, Kamil, DEVLIN, Sam
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:In various examples there is a method performed by a computer-implemented agent in an environment. The method comprises storing a reinforcement learning policy for controlling the computer-implemented agent. The method also comprises storing a distribution as a latent representation of a belief of the computer-implemented agent about at least one other agent in the environment. The method involves executing the computer-implemented agent according to the policy conditioned on parameters characterizing the distribution. Dans divers exemples, l'invention concerne un procédé effectué par un agent mis en œuvre par ordinateur dans un environnement. Le procédé consiste à stocker une politique d'apprentissage par renforcement permettant de commander l'agent mis en œuvre par ordinateur. Le procédé consiste également à stocker une distribution sous la forme d'une représentation latente d'une croyance de l'agent mis en œuvre par ordinateur concernant au moins un autre agent dans l'environnement. Le procédé consiste à exécuter l'agent mis en œuvre par ordinateur selon la politique conditionnée sur des paramètres caractérisant la distribution.