A COMPUTER IMPLEMENTED METHOD AND AN APPARATUS FOR SILENCE DETECTION IN SPEECH RECOGNITION
A computer implemented method for speech recognition from an audio signal is provided.The method comprises: obtaining initial values for silence detection parameters comprising:a lead period; a threshold amplitude; and a terminal period; starting to detect an amplitude of the audio signal at a first...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A computer implemented method for speech recognition from an audio signal is provided.The method comprises: obtaining initial values for silence detection parameters comprising:a lead period; a threshold amplitude; and a terminal period; starting to detect an amplitude of the audio signal at a first time T1 of the audio signal; optionally, adjusting the threshold amplitude based on the detected amplitude; starting the speech recognition from a second time T2 of the audio signal, wherein the second time T2 is at or after the first time T1; starting silence detection from the audio signal when lead period has elapsed after the second time T2 comprising: responsive to detecting amplitude below the threshold amplitude for a duration of the terminal period, terminating the speech recognition and the silence detection at a third time T3 of the audio signal; and adjusting the silence detection parameters based on the detected amplitude changes of the audio signal between the first time T1 and the third time T3.
L'invention concerne un procédé de mis en œuvre par ordinateur pour la reconnaissance de la parole à partir d'un signal audio.Le procédé comprend : l'obtention de valeurs initiales pour des paramètres de détection de silence comprenant : une période initiale; une amplitude de seuil; et une période terminale; le début de la détection d'une amplitude du signal audio à un premier instant T1 du signal audio; éventuellement, l'ajustement de l'amplitude de seuil sur la base de l'amplitude détectée; le début de la reconnaissance de la parole à partir d'un deuxième instant T2 du signal audio, le deuxième instant T2 se situant au premier instant T1 ou après celui-ci; le début de la détection de silence à partir du signal audio lorsque la période initiale s'est écoulée après le deuxième instant T2 comprenant : en réponse à la détection d'une amplitude inférieure à l'amplitude de seuil pendant une durée de la période terminale, la fin de la reconnaissance de la parole et de la détection de silence à un troisième instant T3 du signal audio; et l'ajustement des paramètres de détection de silence sur la base des changements d'amplitude détectés du signal audio entre le premier instant T1 et le troisième instant T3. |
---|