A METHOD AND APPARATUS FOR ADAPTIVE SPEECH RECOGNITION HYPOTHESIS CONSTRUCTION AND SELECTION IN A SPOKEN LANGUAGE TRANSLATION SYSTEM
A method and apparatus for adaptive speech recognition hypothesis are provided, wherein a number of ordered recognition hypotheses are generated and presented in response to a received speech input comprising natural spoken language. Generation of the recognition hypotheses comprises assigning (408)...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | A method and apparatus for adaptive speech recognition hypothesis are provided, wherein a number of ordered recognition hypotheses are generated and presented in response to a received speech input comprising natural spoken language. Generation of the recognition hypotheses comprises assigning (408) basic probabilities to at least one basic component of the speech input using language models and calculating (410) an overall probability of each of the recognition hypotheses using the assigned basic probabilities. The best hypothesis is selected (1802) by a user from the recognition hypotheses. Hypothesis generation is adapted (1810) in response to the selected best hypotheses, wherein the selected hypothesis is analyzed, a list comprising the basic components of the selected best hypothesis and the assigned basic probabilities is generated, credit is assigned to the basic components of the selected hypothesis by raising the assigned basic probabilities, and the basic probabilities of the language model are renormalized. An output is provided (306) comprising the best hypothesis; moreover, the input is translated in response to the selected best hypothesis, and a synthesized translated speech output is provided.
L'invention concerne un procédé et un appareil pour la construction d'hypothèse de reconnaissance vocale adaptative. Un certain nombre d'hypothèses de reconnaissance sont générées et présentées en réponse à une entrée vocale reçue sous forme de langage naturel. La génération des hypothèses de reconnaissance consiste à affecter (408) des probabilités de base à au moins un composant de base de l'entrée vocale à l'aide de modèles de langage et à calculer (410) une probabilité globale de chaque hypothèse de reconnaissance à l'aide des probabilités de base affectées. La meilleure hypothèse est sélectionnée (1802) par un utilisateur à partir des hypothèses de reconnaissance. La génération d'hypothèses (1810) est fonction des meilleures hypothèses sélectionnées, celles-ci étant analysées. Une liste comprenant les composants de base des meilleures hypothèses sélectionnées et les probabilités de base affectées est générée, les composants de base de l'hypothèse sélectionnée sont accrédités par l'augmentation des probabilités de base et les probabilités de base du modèle de langage sont renormalisées. L'entrée est traduite en réaction à la meilleure hypothèse sélectionnée et une sortie de discours traduit de synthèse est générée, chaque sortie (306) comprenant |
---|