面向对抗条件下资源分配的在线多阶段布洛托博弈求解方法

TP39; 未来战场上的作战资源分配是一个存在总资源预算约束的多阶段对抗问题,具有环境高复杂性、动态不确定性、博弈强对抗性.基于布洛托博弈模型,首先把多阶段对抗场景下的资源分配问题建模为双层在线布洛托博弈,然后将原资源分配问题转化为有向无环图上的在线最短路径问题,并借鉴拉格朗日博弈对资源分配问题进行分析求解.此外,提出LagrangeBwK-Exp3-G算法以实现多阶段对抗条件下资源分配问题的高概率遗憾最小化,进一步通过数学推导获得关于时间范围T的高概率遗憾界.最后,设计一个多阶段对抗条件下的卫星通信多信道功率分配实验,从而验证LagrangeBwK-Exp3-G算法具有良好性能....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:智能科学与技术学报 2023-12, Vol.5 (4), p.464-476
Hauptverfasser: 陈少飞, 邹明我, 苏小龙, 罗俊仁, 冯俊侨
Format: Artikel
Sprache:chi
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TP39; 未来战场上的作战资源分配是一个存在总资源预算约束的多阶段对抗问题,具有环境高复杂性、动态不确定性、博弈强对抗性.基于布洛托博弈模型,首先把多阶段对抗场景下的资源分配问题建模为双层在线布洛托博弈,然后将原资源分配问题转化为有向无环图上的在线最短路径问题,并借鉴拉格朗日博弈对资源分配问题进行分析求解.此外,提出LagrangeBwK-Exp3-G算法以实现多阶段对抗条件下资源分配问题的高概率遗憾最小化,进一步通过数学推导获得关于时间范围T的高概率遗憾界.最后,设计一个多阶段对抗条件下的卫星通信多信道功率分配实验,从而验证LagrangeBwK-Exp3-G算法具有良好性能.
ISSN:2096-6652
DOI:10.11959/j.issn.2096-6652.202341