TECHNIQUE FOR CONTROLLING RAN PARAMETERS
A technique for generating a control policy (101) for controlling a radio access network, RAN, is described. As to a method aspect of the technique, report messages indicative of an operating state (800; 801) of the respective cell are received (302) from each of multiple cells (201, 201') of t...
Gespeichert in:
Hauptverfasser: | , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A technique for generating a control policy (101) for controlling a radio access network, RAN, is described. As to a method aspect of the technique, report messages indicative of an operating state (800; 801) of the respective cell are received (302) from each of multiple cells (201, 201') of the RAN. The operating state (800; 801) comprises at least one control parameter (802) of the respective cell (201). The control policy (101) is generated (304) using reinforcement learning, RL, based on cell experiences including first values of the operating state (800; 801), a change of the at least control parameter (802), and second values of the operating state (800; 801) after the change of the at least one control parameter (802), wherein an instance of the control policy for one cell of the multiple cells controls the at least one control parameter of the one cell based on the operating states of the one cell and one or more neighboring cells of the one cell.
L'invention concerne une technique de génération d'une politique de commande (101) pour la commande d'un réseau d'accès radio, RAN. Selon un aspect procédé de la technique, des messages de rapport indiquant un état de fonctionnement (800 ; 801) de la cellule respective sont reçus (302) de chaque cellule parmi de multiples cellules (201, 201') du RAN. L'état de fonctionnement (800 ; 801) comprend au moins un paramètre de commande (802) de la cellule respective (201). La politique de commande (101) est générée (304) à l'aide d'un apprentissage par renforcement, RL, sur la base d'expériences de cellule comprenant des premières valeurs de l'état de fonctionnement (800 ; 801), un changement du ou des paramètres de commande (802), et des secondes valeurs de l'état de fonctionnement (800 ; 801) après le changement du ou des paramètres de commande (802), une instance de la politique de commande pour une cellule parmi les multiples cellules commandant le ou les paramètres de commande de la cellule sur la base des états de fonctionnement de la cellule et d'une ou de plusieurs cellules voisines de la cellule. |
---|