REAL-TIME NAME MISPRONUNCIATION DETECTION

A real-time name mispronunciation detection feature can enable a user to receive instant feedback anytime they have mispronounced another person's name in an online meeting. The feature can receive audio input of a speaker and obtain a transcript of the audio input; identify a name from text of...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SRIVASTAVA, Amit, PARRA, Ana Karen, BOHRA, Tapan, MALLIPEDDI, Akshay
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:A real-time name mispronunciation detection feature can enable a user to receive instant feedback anytime they have mispronounced another person's name in an online meeting. The feature can receive audio input of a speaker and obtain a transcript of the audio input; identify a name from text of the transcript based on names of meeting participants; and extract a portion of the audio input corresponding to the name identified from the text of the transcript. The feature can obtain a reference pronunciation for the name using a user identifier associated with the name; and can obtain a pronunciation score for the name based on a comparison between the reference pronunciation for the name and the portion of the audio input corresponding to the name. The feature can then determine whether the pronunciation score is below a threshold; and in response, notify the speaker of a pronunciation error. L'invention concerne une fonctionnalité de détection en temps réel de mauvaise prononciation de nom, permettant à un utilisateur de recevoir un retour instantané d'information lorsqu'il a prononcé de façon erronée le nom d'une autre personne pendant une réunion en ligne. La fonctionnalité selon l'invention peut : recevoir une entrée audio d'un orateur et obtenir une transcription de l'entrée audio ; identifier un nom dans le texte de la transcription en fonction du nom des participants à la réunion ; et extraire du texte de la transcription une partie de l'entrée audio correspondant au nom identifié. La fonctionnalité peut également : obtenir une prononciation de référence pour le nom donné, au moyen d'un identifiant utilisateur associé au nom ; et obtenir un score de prononciation du nom en fonction d'une comparaison entre la prononciation de référence du nom et la partie de l'entrée audio correspondant au nom. La fonctionnalité peut ensuite : déterminer si le score de prononciation est inférieur à un seuil ; et, en réponse, notifier à l'orateur une erreur de prononciation.