VOICE ACTIVITY DETECTOR AND METHODS THEREFOR

Methods, systems, and apparatuses for a low-complexity acoustic activity detector are disclosed. A method includes forming a sequence of frames by blocking digital data representative of acoustic activity. For each frame, the method includes determining a plurality of power metrics based on a transf...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: YE, Anne, PATURI, Rohit, NEMALA, Sridhar Krishna, RUB, Leonardo, LAROCHE, Jean
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Methods, systems, and apparatuses for a low-complexity acoustic activity detector are disclosed. A method includes forming a sequence of frames by blocking digital data representative of acoustic activity. For each frame, the method includes determining a plurality of power metrics based on a transformation of the frame data from the time-domain to the frequency domain using a discrete Fourier transform having constant coefficients dependent on a plurality of select frequencies within a range of voice frequencies. For each frame, the method also includes determining a plurality of signal to noise ratios for each power metric to a corresponding noise metric. The method also includes, for each frame, determining one or more signal to noise ratios. The method includes determining whether the digital data representative of the acoustic activity includes voice activity by determining whether the signal to noise ratios for each of a plurality of frames satisfies a criterion. L'invention concerne des procédés, des systèmes et des appareils destinés à un détecteur d'activité acoustique de faible complexité. Un procédé comprend une première étape consistant à former une séquence de trames en bloquant des données numériques représentatives d'une activité acoustique. Puis, pour chaque trame, le procédé comprend les étapes consistant à : déterminer une pluralité de mesures de puissance sur la base d'une conversion des données des trames du domaine temporel au domaine fréquentiel à l'aide d'une transformée de Fourier discrète ayant des coefficients constants en fonction d'une pluralité de fréquences sélectionnées dans une plage de fréquences vocales ; déterminer une pluralité de rapports signal sur bruit de chaque mesure de puissance à une mesure de bruit correspondante ; déterminer un ou plusieurs rapports signal sur bruit ; et déterminer si les données numériques représentatives de l'activité acoustique contiennent une activité vocale en déterminant si le rapport signal sur bruit pour chaque trame d'une pluralité de trames répond à un critère.