A ROBUST, SCALABLE AND GENERALIZABLE MACHINE LEARNING PARADIGM FOR MULTI-AGENT APPLICATIONS

Described is a learning system for multi-agent applications. In operation, the system initializes a plurality of learning agents. The learning agents include both tactical agents and strategic agents. The strategic agents take an observation from an environment and select one or more of the tactical...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KHOSLA, Deepak, SOLEYMAN, Sean
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Described is a learning system for multi-agent applications. In operation, the system initializes a plurality of learning agents. The learning agents include both tactical agents and strategic agents. The strategic agents take an observation from an environment and select one or more of the tactical agents to produce an action that is used to control a platform's actuators or simulated movements in the environment to complete a task. Alternatively, the tactical agents produce the action corresponding to a learned low-level behavior to control the platform's actuators or simulated movements in the environment to complete the task. L'invention concerne un système d'apprentissage pour des applications à agents multiples. En fonctionnement, le système initialise une pluralité d'agents d'apprentissage. Les agents d'apprentissage comprennent à la fois des agents tactiques et des agents stratégiques. Les agents stratégiques prennent une observation à partir d'un environnement et sélectionnent un ou plusieurs des agents tactiques pour produire une action qui est utilisée pour commander des actionneurs de plateforme ou des mouvements simulés dans l'environnement afin d'accomplir une tâche. En variante, les agents tactiques produisent l'action correspondant à un comportement de bas niveau appris pour commander les actionneurs de la plate-forme ou les mouvements simulés dans l'environnement afin d'accomplir la tâche.