ELECTRONIC DEVICE FOR GENERATING PERSONALIZED ASR MODEL AND METHOD FOR OPERATING SAME

An electronic device according to various embodiments of the present invention comprises: a processor; and a memory electrically connected to the processor, wherein the memory can store instructions that allow, when executed, the processor to: store text data generated by recognizing user's voi...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	KIM, Sumyeon, PARK, Sungpa, PARK, Sangyeon
Format:	Patent
Sprache:	eng ; fre ; kor
Schlagworte:	ACOUSTICS MUSICAL INSTRUMENTS PHYSICS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	An electronic device according to various embodiments of the present invention comprises: a processor; and a memory electrically connected to the processor, wherein the memory can store instructions that allow, when executed, the processor to: store text data generated by recognizing user's voice data using a given automatic speech recognition (ASR) model, as one piece of utterance data together with the voice data, in an utterance data storage functionally connected to the processor; obtain a candidate for replacing an ASR error portion from a plurality of pieces of utterance data stored in the utterance data storage; generate a personalized ASR model by performing deep learning on the ASR model on the basis of the candidate and user's voice data corresponding to the candidate; receive a user's response to the candidate through an input device functionally connected to the processor; and update the ASR model to the personalized ASR model on the basis of the user's response. Various other embodiments are also possible. La présente invention concerne un dispositif électronique qui, selon différents modes de réalisation, comprend : un processeur ; et une mémoire électriquement connectée au processeur, la mémoire pouvant stocker des instructions qui permettent, lorsqu'elles sont exécutées, au processeur de : stocker des données de texte générées par reconnaissance de données vocales d'utilisateur au moyen d'un modèle de reconnaissance de parole automatique (ASR) donné, en tant qu'élément de données d'énoncé conjointement avec les données vocales, dans un stockage de données d'énoncé fonctionnellement connecté au processeur ; obtenir un candidat pour remplacer une partie d'erreur ASR à partir d'une pluralité d'éléments de données d'énoncé stockées dans le stockage de données d'énoncé ; générer un modèle ASR personnalisé en effectuant un apprentissage profond sur le modèle ASR sur la base des données vocales candidates et de l'utilisateur correspondant au candidat ; recevoir une réponse d'un utilisateur au candidat par l'intermédiaire d'un dispositif d'entrée fonctionnellement connecté au processeur ; et mettre à jour le modèle ASR avec le modèle ASR personnalisé sur la base de la réponse de l'utilisateur. Différents autres modes de réalisation sont également possibles. 본 발명의 다양한 실시예에 따른 전자 장치는 프로세서; 및 상기 프로세서에 전기적으로 연결된 메모리를 포함하고, 상기 메모리는, 실행될 때, 상기 프로세서가: 사용자의 음성 데이터를 주어진 ASR(automatic speech recognition) 모델을 이용하여 인식함으로써 생성된 텍스트 데이터를, 상기 음성 데이터와 함께 하나의 발화 데이터