基于马尔可夫决策过程的算法研究

TP301; 基于马尔可夫决策过程理论,将终端直通选择与有限阶段折扣MDP模型相结合,研究网络吞吐量最优化问题.首先利用MDP对终端直通选择进行建模,再利用有限阶段后向迭代算法给出最优模式选择策略,最后通过大量的仿真实验,对给出的模式选择策略进行评估.结果表明,基于MDP的模式选择方法在最大化吞吐量方面拥有更好的性能,能得出更优的模式选择策略,具有获得更多系统吞吐量的优势....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:河北软件职业技术学院学报 2021, Vol.23 (1), p.8-11
1. Verfasser: 肖铮
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TP301; 基于马尔可夫决策过程理论,将终端直通选择与有限阶段折扣MDP模型相结合,研究网络吞吐量最优化问题.首先利用MDP对终端直通选择进行建模,再利用有限阶段后向迭代算法给出最优模式选择策略,最后通过大量的仿真实验,对给出的模式选择策略进行评估.结果表明,基于MDP的模式选择方法在最大化吞吐量方面拥有更好的性能,能得出更优的模式选择策略,具有获得更多系统吞吐量的优势.
ISSN:1673-2022