A comprehensive study of task-specific adaptation of speech recognition models
Most published adaptation research focuses on speaker adaptation, and on adaptation for noisy channels and background environments. In this paper, we present a study of task adaptation, where the speech recognition models are adapted to a specific application or task, giving significant performance...
Gespeichert in:
Veröffentlicht in: | Speech communication 2004, Vol.42 (1), p.125-139 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Most published adaptation research focuses on speaker adaptation, and on adaptation for noisy channels and background environments. In this paper, we present a study of task adaptation, where the speech recognition models are adapted to a specific application or task, giving significant performance gains. We explore several new questions about adaptation which have not been studied before, and present novel solutions to these problems. For example, we show that adaptation can result in increased out-of-grammar error rates. We present an automatic confidence score mapping algorithm to correct this problem. We show that grammar-dependent acoustic adaptation gives improved performance. In addition, we show that in-grammar acoustic adaptation gives significantly better results. We study acoustic and grammar task adaptation, and show that the gains are additive. Finally we show that adaptation improves both accuracy and speed, where traditional studies have been more focused on accuracy alone. We also study traditional adaptation modes such as supervised and unsupervised adaptation, the use of confidence thresholds for unsupervised adaptation, and the effect of the amount of data on task adaptation.
Die meisten Veröffentlichungen über Adaptierung in der Spracherkennung handeln entweder von Sprecheradaptierung, von der Adaptierung für verrauschte Kanäle oder von Hintergrundadaptierung. Diese Veröffentlichung beschreibt eine Studie über Anwendungsadaptierung, bei der die akustischen Modelle für eine bestimmte Spracherkennungsanwendung adaptiert werden, so dass die Erkennungsleistung für diese Anwendung sich erheblich verbessert. Wir diskutieren neue Probleme der Adaptierung, die bisher noch nicht aufgetreten sind, und beschreiben Lösungen für diese Probleme. Zum Beispiel zeigen wir, dass Adaptierung zu Verschlechterungen der Erkennung ausserhalb der verwendeten Grammatik führen kann. Wir präsentieren einen automatischen Konfidenzkorrekturalgorithmus, der dieses Problem beheben kann. Wir zeigen, dass grammatikabhängige akustische Adaptierung zu Erkennungsratenverbesserungen führen kann. Zusätzlich zeigen wir, dass akustische Adaptierung innerhalb der verwendenten Grammatik zu erheblichen Verbesserungen führen kann. Wir beschreiben akustische Adaptierung und Grammatikadaptierung und zeigen, dass die erreichten Verbesserungen additiv sind. Wir zeigen auch, dass Adaptierung sowohl die Erkennungsrate als auch die Erkennungsgeschwindingkeit verbessert, da bisherige Stu |
---|---|
ISSN: | 0167-6393 1872-7182 |
DOI: | 10.1016/j.specom.2003.09.001 |