TRAITEMENT DE DONNEES D'UNE SEQUENCE VIDEO POUR UN ZOOM SUR UN LOCUTEUR DETECTE DANS LA SEQUENCE

L'invention concerne un traitement d'une séquence vidéo comportant une succession d'images d'un ou plusieurs locuteurs, acquises par une caméra grand angle (102), le procédé comportant : - Une acquisition sonore à partir d'un microphone (103) comportant une pluralité de capt...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: DANIEL, JEROME, RAGOT, STEPHANE, KOLODYNSKI, ROBERT, WARZOCHA, ROBERT WARZOCHA, EMERIT, MARC, ZIELINSKI, ANDRZEJ
Format: Patent
Sprache:fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:L'invention concerne un traitement d'une séquence vidéo comportant une succession d'images d'un ou plusieurs locuteurs, acquises par une caméra grand angle (102), le procédé comportant : - Une acquisition sonore à partir d'un microphone (103) comportant une pluralité de capteurs pour capter un champ sonore ; - Un traitement des données sonores acquises par le microphone (103) pour déterminer au moins une direction (ANG) de provenance de son issu d'un locuteur (LA), relativement à un axe optique (AO) de la caméra grand angle ; - Une génération d'un signal (304) comportant des données (ANG) de ladite direction de provenance du son relativement à l'axe optique (AO) de la caméra, en vue d'exploiter ledit signal lors d'une restitution des images acquises en appliquant un zoom sur une zone autour du locuteur (LA) émettant le son dont la direction de provenance correspond auxdites données du signal. Method and device for processing a video sequence containing a succession of images of one or more participant speakers, captured by a wide-angle camera. The method includes: capturing sound using a microphone having a plurality of sensors for capturing a sound field; processing the audio data captured by the microphone in order to determine at least one direction of origin of sound coming from a participant, relative to an optical axis of the wide-angle camera; generating a signal including data concerning the direction of origin of the sound relative to the optical axis of the camera, for the purpose of utilizing the signal when rendering the captured images by zooming into an area around the participant emitting the sound for which the direction of origin corresponds to the data of the signal.