一种自适应强化学习算法在状态空间构建中的应用

针对模型未知以及具有连续状态的系统控制问题，提出一种基于强化学习的自适应控制策略。在Actor-Critic框架下，建立归一化径向基网络的自适应调节机制，实现未知系统状态空间的动态创建。有效克服了状态空间分割所带来的维度灾难，而且能够使得系统的结构总保持在最佳状态。通过对倒立摆控制的仿真研究验证了方法的有效性。...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	Xi tong fang zhen xue bao 2006, Vol.18 (1), p.188-191
1. Verfasser:	程玉虎王雪松孙伟
Format:	Artikel
Sprache:	chi
Schlagworte:	Actor-Critic学习倒立摆归一化径向基网络状态空间构建
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	针对模型未知以及具有连续状态的系统控制问题，提出一种基于强化学习的自适应控制策略。在Actor-Critic框架下，建立归一化径向基网络的自适应调节机制，实现未知系统状态空间的动态创建。有效克服了状态空间分割所带来的维度灾难，而且能够使得系统的结构总保持在最佳状态。通过对倒立摆控制的仿真研究验证了方法的有效性。
ISSN:	1004-731X
DOI:	10.3969/j.issn.1004-731X.2006.01.048