Continual Learning In Environments With Polynomial Mixing Times

The mixing time of the Markov chain induced by a policy limits performance in real-world continual learning scenarios. Yet, the effect of mixing times on learning in continual reinforcement learning (RL) remains underexplored. In this paper, we characterize problems that are of long-term interest to...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	arXiv.org 2022-10
Hauptverfasser:	Riemer, Matthew, Raparthy, Sharath Chandra, Cases, Ignacio, Subbaraj, Gopeshh, Touzel, Maximilian Puelma, Rish, Irina
Format:	Artikel
Sprache:	eng
Schlagworte:	Algorithms Empirical analysis Machine learning Markov chains Polynomials
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Schreiben Sie den ersten Kommentar!