IMAGE FEATURE PRE-PROCESSING FOR REFERENCE PICTURE RESAMPLING (RPR) DECISION

In one implementation, image features including a down-up PSNR, HOG (Histogram of Oriented Gradients) features and DCT coefficients are extracted, where the down-up PSNR is calculated between the original image and a downscaled (then rescaled to the original resolution) picture, the HOG features are...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: BORDES, Philippe, GALPIN, Franck, DUMAS, Thierry, GUERMOUD, Hassane
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:In one implementation, image features including a down-up PSNR, HOG (Histogram of Oriented Gradients) features and DCT coefficients are extracted, where the down-up PSNR is calculated between the original image and a downscaled (then rescaled to the original resolution) picture, the HOG features are calculated on patches extracted from the original image, and the DCT coefficients are also calculated on the patches. For the DCT coefficients, only a subset at the high frequencies is used. These patches are aggregated and concatenated before feeding to a neural network to predict a QP (Quantization Parameter) switch value. If the QP for the current picture is greater than the predicted QP switch value, then RPR (Reference Picture Resampling) is applied to the current inter picture. Dans une mise en œuvre, des caractéristiques d'image comprenant un PSNR descendant-ascendant, des caractéristiques HOG (histogramme de gradients orientés) et des coefficients DCT sont extraites, le PSNR descendant-ascendant étant calculé entre l'image d'origine et une image à échelle réduite (puis remise à l'échelle à la résolution d'origine), les caractéristiques HOG étant calculées sur des correctifs extraits de l'image d'origine, et les coefficients DCT étant également calculés sur les correctifs. Pour les coefficients DCT, seul un sous-ensemble aux fréquences élevées est utilisé. Ces correctifs sont agrégés et concaténés avant d'alimenter un réseau neuronal afin de prédire une valeur de commutation QP (paramètre de quantification). Si le QP pour l'image courante est supérieur à la valeur de commutation QP prédite, alors le RPR (rééchantillonnage d'image de référence) est appliqué à l'image inter courante.