METHOD FOR SEPARATING AN ACOUSTIC MIX SIGNAL INTO A PLURALITY OF M SOUND CONTRIBUTIONS; ASSOCIATED COMPUTER PROGRAM PRODUCT AND ASSOCIATED READABLE DATA MEDIUM

This method for separating M sources uses a neural network - ANN incorporating an encoder (ε) and M decoders (D i). The processing phase consists in: transforming (14) the acoustic mix signal (y(t)) in order to obtain a magnitude (Y) and a phase (φ) of a mix spectrogram; running (15) the ANN suitabl...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: DOIRE, Clément, OKUBADEJO, Olumide
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:This method for separating M sources uses a neural network - ANN incorporating an encoder (ε) and M decoders (D i). The processing phase consists in: transforming (14) the acoustic mix signal (y(t)) in order to obtain a magnitude (Y) and a phase (φ) of a mix spectrogram; running (15) the ANN suitably parameterized for the magnitude in order to obtain M estimates, the ith estimate (Ŝ l ) being that of the magnitude of the spectrogram of the ith contribution; transforming (20) a combination of the ith estimate (Ŝ l ) with the phase (φ) in order to obtain a pure acoustic signal (s i (t)) of the ith contribution. To determine the optimal parameters of the ANN, each epoch of the learning phase is advantageously based on M independent, asynchronous databases, a batch of the nth database associating an amplitude of a spectrogram of a reference acoustic mix signal and an amplitude of a spectrogram of a reference contribution, which is the nth contribution of the reference acoustic mix signal. Ce procédé de séparation de M sources utilise un réseau de neurones - RNA intégrant un encodeur (ε) et M décodeurs (D i). La phase de traitement consiste à : transformer (14) le signal acoustique de mélange (y(t)) pour obtenir une magnitude (Y) et une phase (φ) d'un spectrogramme de mélange; exécuter (15) le RNA convenablement paramétré sur la magnitude pour obtenir M estimations, la ième estimation (Ŝ l ) étant celle de la magnitude du spectrogramme de la ième contribution; transformer (20) une combinaison de la ième estimation (Ŝ l ) avec la phase (φ) pour obtenir un signal acoustique pure (s i (t)) de la ième contribution. Pour déterminer les paramètres optimaux du RNA, chaque époque de la phase d'apprentissage s'appuie avantageusement sur M bases de données indépendantes et asynchrones, un lot de la nième base de données associant une amplitude d'un spectrogramme d'un signal acoustique de mélange de référence et une amplitude d'un spectrogramme d'une contribution de référence, qui est la nième contribution du signal acoustique de mélange de référence.