METHOD, DEVICE, AND SYSTEM OF NOISE REDUCTION AND SPEECH ENHANCEMENT

System and method for producing enhanced speech data associated with at least one speaker. The process of producing the enhanced speech data comprises: receiving distant signal data from a distant acoustic sensor; receiving proximate signal data from a proximate acoustic sensor located closer to the...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	RAIFEL, MARK, AVARGEL, YEKUTIEL
Format:	Patent
Sprache:	eng ; fre
Schlagworte:	ACOUSTICS MEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC ORINFRASONIC WAVES MEASURING MUSICAL INSTRUMENTS PHYSICS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION TESTING
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	System and method for producing enhanced speech data associated with at least one speaker. The process of producing the enhanced speech data comprises: receiving distant signal data from a distant acoustic sensor; receiving proximate signal data from a proximate acoustic sensor located closer to the speaker than the distant acoustic sensor; receiving optical data originating from an optical unit configured for optically detecting acoustic signals in an area of the speaker and outputting data associated with speech of the speaker; processing the distant and proximate signals data for producing a speech reference and a noise reference; operating an adaptive noise estimation module, which identifies stationary and/or transient noise signal components, using the noise reference; and operating a post filtering module, which uses the optical data, speech reference and identified noise signal components for creating an enhanced speech data. L'invention concerne un système et un procédé pour produire des données de parole améliorées associées à au moins un orateur. Le procédé de production de données de parole améliorées consiste : à recevoir des données de signal distantes provenant d'un capteur acoustique distant ; à recevoir des données de signal de proximité provenant d'un capteur acoustique de proximité situé plus près de l'orateur que le capteur acoustique distant ; à recevoir des données optiques provenant d'une unité optique configurée pour détecter optiquement des signaux acoustiques dans une zone de l'orateur, et à délivrer des données associées à la voix de l'orateur ; à traiter les données de signaux distantes et de proximité pour produire une référence de parole et une référence de bruit ; à faire fonctionner un module d'estimation de bruit adaptative, qui identifie des composantes de signal de bruit stationnaires et/ou transitoires à l'aide de la référence de bruit ; et à faire fonctionner un module de post-filtrage, qui utilise les données optiques, la référence de parole et les composantes de signal de bruit identifiées pour créer des données de parole améliorées.