基于马尔可夫决策过程的算法研究
TP301; 基于马尔可夫决策过程理论,将终端直通选择与有限阶段折扣MDP模型相结合,研究网络吞吐量最优化问题.首先利用MDP对终端直通选择进行建模,再利用有限阶段后向迭代算法给出最优模式选择策略,最后通过大量的仿真实验,对给出的模式选择策略进行评估.结果表明,基于MDP的模式选择方法在最大化吞吐量方面拥有更好的性能,能得出更优的模式选择策略,具有获得更多系统吞吐量的优势....
Gespeichert in:
Veröffentlicht in: | 河北软件职业技术学院学报 2021, Vol.23 (1), p.8-11 |
---|---|
1. Verfasser: | |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | TP301; 基于马尔可夫决策过程理论,将终端直通选择与有限阶段折扣MDP模型相结合,研究网络吞吐量最优化问题.首先利用MDP对终端直通选择进行建模,再利用有限阶段后向迭代算法给出最优模式选择策略,最后通过大量的仿真实验,对给出的模式选择策略进行评估.结果表明,基于MDP的模式选择方法在最大化吞吐量方面拥有更好的性能,能得出更优的模式选择策略,具有获得更多系统吞吐量的优势. |
---|---|
ISSN: | 1673-2022 |