Design considerations for knowledge source representations of a stochastically-based natural language understanding component

We describe a stochastic component for spoken natural language understanding in an application for train travel information retrieval in French. The aim is to discuss the design considerations for representing knowledge sources appropriately in such a parsing component. The development focuses on th...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Speech communication 1999-06, Vol.28 (2), p.141-154
1. Verfasser: Minker, Wolfgang
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:We describe a stochastic component for spoken natural language understanding in an application for train travel information retrieval in French. The aim is to discuss the design considerations for representing knowledge sources appropriately in such a parsing component. The development focuses on the design of a stochastic model topology that is optimally adapted in quality and complexity to the task model and the available training data. Another important issue concerns the iterative semantic labeling of large data amounts used for the component training. The parser has been evaluated on both corrected and uncorrected speech recognizer output transcriptions. Wir beschreiben eine stochastische Komponente zum Verständnis natürlich gesprochener Sprache im Rahmen einer Anwendung zur Zugfahrplanauskunft in Französisch. Die Entwicklung schließt die Konzeption eines stochastischen Modells ein, welches optimal in Qualität und in Komplexität an den Anwendungsbereich sowie an die zur Verfügung stehenden Trainingsdaten angepaßt ist. Ein weiterer wichtiger Aspekt behandelt die iterative semantische Etikettierung großer Datenmengen, die zum Systemtraining benötigt werden. Die Analysekomponente wurde mit Benutzeranfragen in Form von korrigierten und unkorrigierten Transkriptionen des Spracherkenners getestet. Nous décrivons un analyseur stochastique pour la compréhension de la parole spontanée dans une application de demande d'informations pour les transports ferroviaires en langue française. Le développement d'un tel analyseur se focalise sur la conception d'un modèle stochastique qui est adapté de manière optimale en qualité et en complexité à la couverture du domaine et aux données disponibles pour l'apprentissage. Un autre facteur important concerne la création, par une méthode d'étiquetage itérative, d'un corpus de représentations sémantiques sur la base desquelles le modèle stochastique peut être établi. L'analyseur a été testé sur les transcriptions corrigées des requêtes formulées par des utilisateurs et sur les transcriptions exactes du module de reconnaissance.
ISSN:0167-6393
1872-7182
DOI:10.1016/S0167-6393(99)00005-9