一种自适应强化学习算法在状态空间构建中的应用

针对模型未知以及具有连续状态的系统控制问题,提出一种基于强化学习的自适应控制策略。在Actor-Critic框架下,建立归一化径向基网络的自适应调节机制,实现未知系统状态空间的动态创建。有效克服了状态空间分割所带来的维度灾难,而且能够使得系统的结构总保持在最佳状态。通过对倒立摆控制的仿真研究验证了方法的有效性。...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Xi tong fang zhen xue bao 2006, Vol.18 (1), p.188-191
1. Verfasser: 程玉虎 王雪松 孙伟
Format: Artikel
Sprache:chi
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 191
container_issue 1
container_start_page 188
container_title Xi tong fang zhen xue bao
container_volume 18
creator 程玉虎 王雪松 孙伟
description 针对模型未知以及具有连续状态的系统控制问题,提出一种基于强化学习的自适应控制策略。在Actor-Critic框架下,建立归一化径向基网络的自适应调节机制,实现未知系统状态空间的动态创建。有效克服了状态空间分割所带来的维度灾难,而且能够使得系统的结构总保持在最佳状态。通过对倒立摆控制的仿真研究验证了方法的有效性。
doi_str_mv 10.3969/j.issn.1004-731X.2006.01.048
format Article
fullrecord <record><control><sourceid>wanfang_jour_chong</sourceid><recordid>TN_cdi_wanfang_journals_xtfzxb200601048</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><cqvip_id>21071846</cqvip_id><wanfj_id>xtfzxb200601048</wanfj_id><sourcerecordid>xtfzxb200601048</sourcerecordid><originalsourceid>FETCH-LOGICAL-c598-8dd61c93c0bdd40a33039112237dac9aa3f2c8eb2193484630101062c859e7d93</originalsourceid><addsrcrecordid>eNo9j81Kw0AUhWehYKl9CRFcJd6ZSZOZpRb_oOCmC3dhMklqaknRKBZXVQqC6K5aEBFXWoW6UaRGHyc_9i2cUpG7OHD4zrkchBYx6JSbfLmhB1EU6hjA0CyKd3QCYOqAdTDYDCr8-3OoFEWBA4AxEMatAlpNRp386ern_GXcOUvjXvodp5c36fAx-XzIX_vZ23V6N8gvPrLOaf4cj_vv2X03_YqT0TC_7So-7w3m0awvmpFX-tMiqq2v1SqbWnV7Y6uyUtVkmTONua6JJacSHNc1QFAKlGNMCLVcIbkQ1CeSeQ7BnBrMMClgdabyytyzXE6LaGlaeyxCX4R1u9E6OgjVQ7t96J-0nclklTCYIhempNxthfX9QLGOkHt-0PRsgsHCk_pfJO9wwg</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>一种自适应强化学习算法在状态空间构建中的应用</title><source>Alma/SFX Local Collection</source><creator>程玉虎 王雪松 孙伟</creator><creatorcontrib>程玉虎 王雪松 孙伟</creatorcontrib><description>针对模型未知以及具有连续状态的系统控制问题,提出一种基于强化学习的自适应控制策略。在Actor-Critic框架下,建立归一化径向基网络的自适应调节机制,实现未知系统状态空间的动态创建。有效克服了状态空间分割所带来的维度灾难,而且能够使得系统的结构总保持在最佳状态。通过对倒立摆控制的仿真研究验证了方法的有效性。</description><identifier>ISSN: 1004-731X</identifier><identifier>DOI: 10.3969/j.issn.1004-731X.2006.01.048</identifier><language>chi</language><publisher>中国矿业大学信息与电气工程学院,江苏徐州,221008</publisher><subject>Actor-Critic学习 ; 倒立摆 ; 归一化径向基网络 ; 状态空间构建</subject><ispartof>Xi tong fang zhen xue bao, 2006, Vol.18 (1), p.188-191</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://image.cqvip.com/vip1000/qk/96569X/96569X.jpg</thumbnail><link.rule.ids>314,776,780,4010,27902,27903,27904</link.rule.ids></links><search><creatorcontrib>程玉虎 王雪松 孙伟</creatorcontrib><title>一种自适应强化学习算法在状态空间构建中的应用</title><title>Xi tong fang zhen xue bao</title><addtitle>Journal of System Simulation</addtitle><description>针对模型未知以及具有连续状态的系统控制问题,提出一种基于强化学习的自适应控制策略。在Actor-Critic框架下,建立归一化径向基网络的自适应调节机制,实现未知系统状态空间的动态创建。有效克服了状态空间分割所带来的维度灾难,而且能够使得系统的结构总保持在最佳状态。通过对倒立摆控制的仿真研究验证了方法的有效性。</description><subject>Actor-Critic学习</subject><subject>倒立摆</subject><subject>归一化径向基网络</subject><subject>状态空间构建</subject><issn>1004-731X</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2006</creationdate><recordtype>article</recordtype><recordid>eNo9j81Kw0AUhWehYKl9CRFcJd6ZSZOZpRb_oOCmC3dhMklqaknRKBZXVQqC6K5aEBFXWoW6UaRGHyc_9i2cUpG7OHD4zrkchBYx6JSbfLmhB1EU6hjA0CyKd3QCYOqAdTDYDCr8-3OoFEWBA4AxEMatAlpNRp386ern_GXcOUvjXvodp5c36fAx-XzIX_vZ23V6N8gvPrLOaf4cj_vv2X03_YqT0TC_7So-7w3m0awvmpFX-tMiqq2v1SqbWnV7Y6uyUtVkmTONua6JJacSHNc1QFAKlGNMCLVcIbkQ1CeSeQ7BnBrMMClgdabyytyzXE6LaGlaeyxCX4R1u9E6OgjVQ7t96J-0nclklTCYIhempNxthfX9QLGOkHt-0PRsgsHCk_pfJO9wwg</recordid><startdate>2006</startdate><enddate>2006</enddate><creator>程玉虎 王雪松 孙伟</creator><general>中国矿业大学信息与电气工程学院,江苏徐州,221008</general><scope>2RA</scope><scope>92L</scope><scope>CQIGP</scope><scope>W92</scope><scope>~WA</scope><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>2006</creationdate><title>一种自适应强化学习算法在状态空间构建中的应用</title><author>程玉虎 王雪松 孙伟</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-c598-8dd61c93c0bdd40a33039112237dac9aa3f2c8eb2193484630101062c859e7d93</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2006</creationdate><topic>Actor-Critic学习</topic><topic>倒立摆</topic><topic>归一化径向基网络</topic><topic>状态空间构建</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>程玉虎 王雪松 孙伟</creatorcontrib><collection>中文科技期刊数据库</collection><collection>中文科技期刊数据库-CALIS站点</collection><collection>中文科技期刊数据库-7.0平台</collection><collection>中文科技期刊数据库-工程技术</collection><collection>中文科技期刊数据库- 镜像站点</collection><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>Xi tong fang zhen xue bao</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>程玉虎 王雪松 孙伟</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>一种自适应强化学习算法在状态空间构建中的应用</atitle><jtitle>Xi tong fang zhen xue bao</jtitle><addtitle>Journal of System Simulation</addtitle><date>2006</date><risdate>2006</risdate><volume>18</volume><issue>1</issue><spage>188</spage><epage>191</epage><pages>188-191</pages><issn>1004-731X</issn><abstract>针对模型未知以及具有连续状态的系统控制问题,提出一种基于强化学习的自适应控制策略。在Actor-Critic框架下,建立归一化径向基网络的自适应调节机制,实现未知系统状态空间的动态创建。有效克服了状态空间分割所带来的维度灾难,而且能够使得系统的结构总保持在最佳状态。通过对倒立摆控制的仿真研究验证了方法的有效性。</abstract><pub>中国矿业大学信息与电气工程学院,江苏徐州,221008</pub><doi>10.3969/j.issn.1004-731X.2006.01.048</doi><tpages>4</tpages></addata></record>
fulltext fulltext
identifier ISSN: 1004-731X
ispartof Xi tong fang zhen xue bao, 2006, Vol.18 (1), p.188-191
issn 1004-731X
language chi
recordid cdi_wanfang_journals_xtfzxb200601048
source Alma/SFX Local Collection
subjects Actor-Critic学习
倒立摆
归一化径向基网络
状态空间构建
title 一种自适应强化学习算法在状态空间构建中的应用
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T01%3A02%3A56IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-wanfang_jour_chong&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E4%B8%80%E7%A7%8D%E8%87%AA%E9%80%82%E5%BA%94%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E7%AE%97%E6%B3%95%E5%9C%A8%E7%8A%B6%E6%80%81%E7%A9%BA%E9%97%B4%E6%9E%84%E5%BB%BA%E4%B8%AD%E7%9A%84%E5%BA%94%E7%94%A8&rft.jtitle=Xi%20tong%20fang%20zhen%20xue%20bao&rft.au=%E7%A8%8B%E7%8E%89%E8%99%8E%20%E7%8E%8B%E9%9B%AA%E6%9D%BE%20%E5%AD%99%E4%BC%9F&rft.date=2006&rft.volume=18&rft.issue=1&rft.spage=188&rft.epage=191&rft.pages=188-191&rft.issn=1004-731X&rft_id=info:doi/10.3969/j.issn.1004-731X.2006.01.048&rft_dat=%3Cwanfang_jour_chong%3Extfzxb200601048%3C/wanfang_jour_chong%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_cqvip_id=21071846&rft_wanfj_id=xtfzxb200601048&rfr_iscdi=true