Procédé de séparation d'un signal acoustique de mélange en une pluralité de M contributions sonores ; Produit programme d'ordinateur et support lisible d'informations associés
Procédé de séparation d'un signal acoustique de mélange en une pluralité de M contributions sonores ; Produit programme d'ordinateur et support lisible d'informations associés. Ce procédé de séparation de M sources utilise un réseau de neurones - RNA intégrant un encodeur ( ) et M déc...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Procédé de séparation d'un signal acoustique de mélange en une pluralité de M contributions sonores ; Produit programme d'ordinateur et support lisible d'informations associés. Ce procédé de séparation de M sources utilise un réseau de neurones - RNA intégrant un encodeur ( ) et M décodeurs ( ). La phase de traitement consiste à : transformer (14) le signal acoustique de mélange ( ) pour obtenir une magnitude ( ) et une phase ( ) d'un spectrogramme de mélange ; exécuter (15) le RNA convenablement paramétré sur la magnitude pour obtenir M estimations, la ième estimation ( ) étant celle de la magnitude du spectrogramme de la ième contribution ; transformer (20) une combinaison de la ième estimation ( ) avec la phase ( ) pour obtenir un signal acoustique pure ( de la ième contribution. Pour déterminer les paramètres optimaux du RNA, chaque époque de la phase d'apprentissage s'appuie avantageusement sur M bases de données indépendantes et asynchrones, un lot de la nième base de données associant une amplitude d'un spectrogramme d'un signal acoustique de mélange de référence et une amplitude d'un spectrogramme d'une contribution de référence, qui est la nième contribution du signal acoustique de mélange de référence. Figure pour l'abrégé : Figure 1
This method for separating M sources uses a neural network - ANN incorporating an encoder (ε) and M decoders (D i). The processing phase consists in: transforming (14) the acoustic mix signal (y(t)) in order to obtain a magnitude (Y) and a phase (φ) of a mix spectrogram; running (15) the ANN suitably parameterized for the magnitude in order to obtain M estimates, the ith estimate (Ŝ l ) being that of the magnitude of the spectrogram of the ith contribution; transforming (20) a combination of the ith estimate (Ŝ l ) with the phase (φ) in order to obtain a pure acoustic signal (s i (t)) of the ith contribution. To determine the optimal parameters of the ANN, each epoch of the learning phase is advantageously based on M independent, asynchronous databases, a batch of the nth database associating an amplitude of a spectrogram of a reference acoustic mix signal and an amplitude of a spectrogram of a reference contribution, which is the nth contribution of the reference acoustic mix signal. |
---|