ELECTRONIC DEVICE PERFORMING SPEECH RECOGNITION AND METHOD OF OPERATING ELECTRONIC DEVICE

An electronic device according to various embodiments of the present invention comprises a network interface, a processor, and at least one memory, wherein the at least one memory is configured to store a generic language model for automatic speech recognition (ASR) and a plurality of domain-based l...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	KIM, Woonsoo, UM, Taekwang, LEE, Jungin, JE, Seongmin, BYUN, Dooho, JUNG, Seokyeong
Format:	Patent
Sprache:	eng ; fre ; kor
Schlagworte:	ACOUSTICS CALCULATING COMPUTING COUNTING DEAF-AID SETS ELECTRIC COMMUNICATION TECHNIQUE ELECTRIC DIGITAL DATA PROCESSING ELECTRICITY LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKEACOUSTIC ELECTROMECHANICAL TRANSDUCERS MUSICAL INSTRUMENTS PHYSICS PUBLIC ADDRESS SYSTEMS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	An electronic device according to various embodiments of the present invention comprises a network interface, a processor, and at least one memory, wherein the at least one memory is configured to store a generic language model for automatic speech recognition (ASR) and a plurality of domain-based language models. In particular, the at least one memory can, when activated, store instructions capable of causing the processor to: receive first speech data from an external device; using the generic language model, process the first speech data through the ASR, thereby generating first text data associated with at least one task to be executed by a system; determine, at least in part on the basis of the first text data, a domain associated with the task; select one domain-based language model associated with the determined domain; receive second speech data from the external device after receiving the first speech data and before executing the task; and using the generic language model and the selected one domain-based language model, process the second speech data through the ASR, thereby generating second text data. Le dispositif électronique selon divers modes de réalisation de la présente invention comprend une interface réseau, un processeur et au moins une mémoire, la ou les mémoire(s) étant configurée(s) pour stocker un modèle de langage générique pour la reconnaissance automatique de la parole (ASR) et une pluralité de modèles de langage basés sur le domaine. En particulier, la ou les mémoire(s) peu(ven)t, lorsqu'elle(s) est/sont activée(s), stocker des instructions pouvant amener le processeur à : recevoir des premières données de parole provenant d'un dispositif externe ; utiliser le modèle de langage générique, traiter les premières données de parole par l'intermédiaire de l'ASR afin de générer ainsi des premières données de texte associées à au moins une tâche devant être exécutée par un système ; déterminer, au moins en partie sur la base des premières données de texte, un domaine associé à la tâche ; sélectionner un modèle de langage basé sur le domaine associé au domaine déterminé ; recevoir des secondes données de parole provenant du dispositif externe après avoir reçu les premières données de parole et avant d'exécuter la tâche ; et utiliser le modèle de langage générique et le modèle de langage sélectionné basé sur le domaine, traiter les secondes données de parole par l'intermédiaire de l'ASR afin de générer ainsi des secondes données de tex