基于强化学习的高能效基站动态调度方法

TP391; 随着移动通信技术的升级与移动通信产业的兴起,移动互联网正蓬勃发展.然而,由于移动设备爆发式增长,网络规模不断扩大和用户对服务质量的要求的不断提高,移动互联网络正面临着下一场技术革命.虽然5G技术可以通过密集的网络部署来实现千百倍的网络性能提升,但同信道干扰和高突发性的用户请求等问题使得该方案下需要消耗巨大的能量.为了在5G网络中提供高性能服务,升级改进现有网络管理方案势在必行.针对这些问题,使用带缓存队列的短周期管理框架实现对请求突发场景的敏捷平滑管理,避免由突发性请求导致的服务质量剧烈波动.此外,采用深度强化学习方法对用户分布、通信需求等进行自我学习,从而推测出基站的负载变化规...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	计算机科学 2021, Vol.48 (11), p.363-371
Hauptverfasser:	曾德泽, 李跃鹏, 赵宇阳, 顾琳
Format:	Artikel
Sprache:	chi
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	TP391; 随着移动通信技术的升级与移动通信产业的兴起,移动互联网正蓬勃发展.然而,由于移动设备爆发式增长,网络规模不断扩大和用户对服务质量的要求的不断提高,移动互联网络正面临着下一场技术革命.虽然5G技术可以通过密集的网络部署来实现千百倍的网络性能提升,但同信道干扰和高突发性的用户请求等问题使得该方案下需要消耗巨大的能量.为了在5G网络中提供高性能服务,升级改进现有网络管理方案势在必行.针对这些问题,使用带缓存队列的短周期管理框架实现对请求突发场景的敏捷平滑管理,避免由突发性请求导致的服务质量剧烈波动.此外,采用深度强化学习方法对用户分布、通信需求等进行自我学习,从而推测出基站的负载变化规律,进而实现对能量的预调度和预分配,在保证服务质量的同时提高能量的利用率.文中提出的双缓冲DQN算法在收敛速度上比传统DQN算法提高了近20％,且与当前广泛使用的基站常开策略相比,该算法能够节约4.8％的能量消耗.
ISSN:	1002-137X
DOI:	10.11896/jsjkx.201000008