基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法
TN914%TN973; 为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法.针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数.为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架.该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题.采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率.仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性....
Gespeichert in:
Veröffentlicht in: | 电子与信息学报 2022-08, Vol.44 (8), p.2814-2823 |
---|---|
Hauptverfasser: | , , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | TN914%TN973; 为提高复杂电磁环境下跳频异步组网的抗干扰性能,该文提出一种基于集中式训练和分散式执行框架的多智能体模糊深度强化学习(MFDRL-CTDE)算法.针对多种干扰并存的复杂电磁环境和异步组网结构,设计了相应的状态-动作空间和奖赏函数.为应对智能体之间的相互影响和动态的环境,引入集中式训练和分散式执行(CTDE)框架.该文提出基于模糊推理系统的融合权重分配策略,用于解决网络融合过程中各智能体的权重分配问题.采用竞争性深度Q网络算法和优先经验回放技术以提高算法的效率.仿真结果表明,该算法在收敛速度和最佳性能方面都具有较大优势,且对多变复杂电磁环境具有较好的适应性. |
---|---|
ISSN: | 1009-5896 |
DOI: | 10.11999/JEIT210608 |