REINFORCEMENT LEARNING BASED RATE CONTROL

Implementations of the subject matter described herein provide a solution for rate control based on reinforcement learning. In this solution, an encoding state of a video encoder is determined, the encoding state being associated with encoding of a first video unit by the video encoder. An encoding...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MEZENTSEV, ANDREY, LU, MEI-HSUAN, LI, JIAHAO, HOLCOMB, W. TOM, LI, BIN, LEE, MINGIEH, LU, YAN
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Implementations of the subject matter described herein provide a solution for rate control based on reinforcement learning. In this solution, an encoding state of a video encoder is determined, the encoding state being associated with encoding of a first video unit by the video encoder. An encoding parameter associated with rate control in the video encoder is determining by a reinforcement learning model and based on the encoding state of the video encoder. A second video unit different from the first video unit is encoded based on the encoding parameter. In this way, it is possible to achieve a better quality of experience (QOE) for real time communication with computation overhead being reduced. La présente invention concerne, selon des modes de réalisation, une solution de régulation de débit basée sur l'apprentissage de renforcement. Dans cette solution, un état de codage d'un codeur vidéo est déterminé, l'état de codage étant associé au codage d'une première unité vidéo par le codeur vidéo. Un paramètre de codage associé à une commande de débit dans le codeur vidéo est déterminé par un modèle d'apprentissage de renforcement et sur la base de l'état de codage du codeur vidéo. Une seconde unité vidéo différente de la première unité vidéo est codée sur la base du paramètre de codage. De cette manière, il est possible d'obtenir une meilleure qualité d'expérience (QOE) pour une communication en temps réel tout en réduisant le surdébit de calcul.