基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法
TN914%TN973; 为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法.针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数.为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架.该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题.采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率.仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性....
Gespeichert in:
Veröffentlicht in: | 电子与信息学报 2022-08, Vol.44 (8), p.2814-2823 |
---|---|
Hauptverfasser: | , , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | 2823 |
---|---|
container_issue | 8 |
container_start_page | 2814 |
container_title | 电子与信息学报 |
container_volume | 44 |
creator | 赵知劲 朱家晟 叶学义 尚俊娜 |
description | TN914%TN973; 为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法.针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数.为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架.该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题.采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率.仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性. |
doi_str_mv | 10.11999/JEIT210608 |
format | Article |
fullrecord | <record><control><sourceid>wanfang_jour</sourceid><recordid>TN_cdi_wanfang_journals_dzkxxk202208024</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><wanfj_id>dzkxxk202208024</wanfj_id><sourcerecordid>dzkxxk202208024</sourcerecordid><originalsourceid>FETCH-LOGICAL-s1024-16073460a9d7f949586160bacdaa3590e2a1970dcb0aa9bad6e61c71164ba4e13</originalsourceid><addsrcrecordid>eNotjctKw0AYRmehYKld-RCuov8_SSaZpZSqlYKbuC6Tm2glgkEsbi2CRYRSbLEbL0hxU1GzKI3mbTJJfQsDdXXg4_AdQtYQNhA555t7tbpFERiYS6SEAFzRTc5WSCUMj2ygKjIDQC0RSz7GaXwnX0fZQzy_StKkn70951E3m37KeCx_Ynk7kJNxOnvKR535NPp96eXfnTzpLfysO5Szr-zmQ15H-WSQvw-z6H6VLPviJPQq_yyTg-2aVd1VGvs79epWQwkRqKYgA0PVGAjuGj7XuG6yYrKF4wqh6hw8KpAb4Do2CMFt4TKPoWMgMs0Wmodqmawvfi9E4IvgsHl8en4WFMWme9lqt1sUKAWzSKl_Kq9v-w</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法</title><source>Alma/SFX Local Collection</source><creator>赵知劲 ; 朱家晟 ; 叶学义 ; 尚俊娜</creator><creatorcontrib>赵知劲 ; 朱家晟 ; 叶学义 ; 尚俊娜</creatorcontrib><description>TN914%TN973; 为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法.针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数.为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架.该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题.采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率.仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性.</description><identifier>ISSN: 1009-5896</identifier><identifier>DOI: 10.11999/JEIT210608</identifier><language>chi</language><publisher>杭州电子科技大学通信工程学院 杭州 310018%杭州电子科技大学通信工程学院 杭州 310018</publisher><ispartof>电子与信息学报, 2022-08, Vol.44 (8), p.2814-2823</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://www.wanfangdata.com.cn/images/PeriodicalImages/dzkxxk/dzkxxk.jpg</thumbnail><link.rule.ids>314,780,784,27924,27925</link.rule.ids></links><search><creatorcontrib>赵知劲</creatorcontrib><creatorcontrib>朱家晟</creatorcontrib><creatorcontrib>叶学义</creatorcontrib><creatorcontrib>尚俊娜</creatorcontrib><title>基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法</title><title>电子与信息学报</title><description>TN914%TN973; 为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法.针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数.为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架.该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题.采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率.仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性.</description><issn>1009-5896</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2022</creationdate><recordtype>article</recordtype><recordid>eNotjctKw0AYRmehYKld-RCuov8_SSaZpZSqlYKbuC6Tm2glgkEsbi2CRYRSbLEbL0hxU1GzKI3mbTJJfQsDdXXg4_AdQtYQNhA555t7tbpFERiYS6SEAFzRTc5WSCUMj2ygKjIDQC0RSz7GaXwnX0fZQzy_StKkn70951E3m37KeCx_Ynk7kJNxOnvKR535NPp96eXfnTzpLfysO5Szr-zmQ15H-WSQvw-z6H6VLPviJPQq_yyTg-2aVd1VGvs79epWQwkRqKYgA0PVGAjuGj7XuG6yYrKF4wqh6hw8KpAb4Do2CMFt4TKPoWMgMs0Wmodqmawvfi9E4IvgsHl8en4WFMWme9lqt1sUKAWzSKl_Kq9v-w</recordid><startdate>20220801</startdate><enddate>20220801</enddate><creator>赵知劲</creator><creator>朱家晟</creator><creator>叶学义</creator><creator>尚俊娜</creator><general>杭州电子科技大学通信工程学院 杭州 310018%杭州电子科技大学通信工程学院 杭州 310018</general><general>中国电子科技集团第 36研究所通信系统信息控制技术国家级重点实验室 嘉兴 314001</general><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>20220801</creationdate><title>基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法</title><author>赵知劲 ; 朱家晟 ; 叶学义 ; 尚俊娜</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-s1024-16073460a9d7f949586160bacdaa3590e2a1970dcb0aa9bad6e61c71164ba4e13</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2022</creationdate><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>赵知劲</creatorcontrib><creatorcontrib>朱家晟</creatorcontrib><creatorcontrib>叶学义</creatorcontrib><creatorcontrib>尚俊娜</creatorcontrib><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>电子与信息学报</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>赵知劲</au><au>朱家晟</au><au>叶学义</au><au>尚俊娜</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法</atitle><jtitle>电子与信息学报</jtitle><date>2022-08-01</date><risdate>2022</risdate><volume>44</volume><issue>8</issue><spage>2814</spage><epage>2823</epage><pages>2814-2823</pages><issn>1009-5896</issn><abstract>TN914%TN973; 为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法.针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数.为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架.该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题.采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率.仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性.</abstract><pub>杭州电子科技大学通信工程学院 杭州 310018%杭州电子科技大学通信工程学院 杭州 310018</pub><doi>10.11999/JEIT210608</doi><tpages>10</tpages></addata></record> |
fulltext | fulltext |
identifier | ISSN: 1009-5896 |
ispartof | 电子与信息学报, 2022-08, Vol.44 (8), p.2814-2823 |
issn | 1009-5896 |
language | chi |
recordid | cdi_wanfang_journals_dzkxxk202208024 |
source | Alma/SFX Local Collection |
title | 基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法 |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2024-12-28T03%3A21%3A06IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-wanfang_jour&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E5%A4%9A%E6%99%BA%E8%83%BD%E4%BD%93%E6%A8%A1%E7%B3%8A%E6%B7%B1%E5%BA%A6%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E7%9A%84%E8%B7%B3%E9%A2%91%E7%BB%84%E7%BD%91%E6%99%BA%E8%83%BD%E6%8A%97%E5%B9%B2%E6%89%B0%E5%86%B3%E7%AD%96%E7%AE%97%E6%B3%95&rft.jtitle=%E7%94%B5%E5%AD%90%E4%B8%8E%E4%BF%A1%E6%81%AF%E5%AD%A6%E6%8A%A5&rft.au=%E8%B5%B5%E7%9F%A5%E5%8A%B2&rft.date=2022-08-01&rft.volume=44&rft.issue=8&rft.spage=2814&rft.epage=2823&rft.pages=2814-2823&rft.issn=1009-5896&rft_id=info:doi/10.11999/JEIT210608&rft_dat=%3Cwanfang_jour%3Edzkxxk202208024%3C/wanfang_jour%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_wanfj_id=dzkxxk202208024&rfr_iscdi=true |