END-TO-END LEARNING-BASED, EG NEURAL NETWORK, PRE-PROCESSING AND POST-PROCESSING OPTIMIZATION FOR IMAGE AND VIDEO CODING
Nonlinear peri-codec optimization for image and video coding includes obtaining a source image including pixel values expressed in a first defined image sample space, generating a neuralized image representing the source image, the neuralized image including pixel values that are expressed as neural...
Gespeichert in:
Hauptverfasser: | , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Nonlinear peri-codec optimization for image and video coding includes obtaining a source image including pixel values expressed in a first defined image sample space, generating a neuralized image representing the source image, the neuralized image including pixel values that are expressed as neural latent space values, encoding the input image wherein the neural latent space values are used as pixel values in a second defined image sample space and the input image is in an operative image format of the encoder, such that a decoder decodes the encoded image to obtain a reconstructed image in the second defined image sample space, wherein the reconstructed image is a reconstructed neuralized image including reconstructed neural latent space values, such that a deneuralized reconstructed image corresponding to the source image is obtained by a nonlinear post-codec image processor in the first defined image sample space.
Une optimisation pré-codec non linéaire permettant un codage d'images et de vidéos comprend les étapes consistant à : obtenir une image source contenant des valeurs de pixels exprimées dans un premier espace d'échantillons d'image défini ; générer une image neuronalisée représentant l'image source, l'image neuronalisée contenant des valeurs de pixels qui sont exprimées en tant que valeurs d'espace latent neuronal ; coder l'image d'entrée, les valeurs d'espace latent neuronal étant utilisées en tant que valeurs de pixels dans un second espace d'échantillons d'image défini et l'image d'entrée étant dans un format d'image opérationnel du codeur, de telle sorte qu'un décodeur peut décoder l'image codée de façon à obtenir une image reconstruite dans le second espace d'échantillons d'image défini, l'image reconstruite étant une image reconstruite neuronalisée contenant des valeurs d'espace latent neuronal reconstruit, de telle sorte qu'une image reconstruite déneuronalisée correspondant à l'image source est obtenue par un processeur d'images post-codec non linéaire dans le premier espace d'échantillons d'image défini. |
---|