SPEECH GENERATION USING CROSSLINGUAL PHONEME MAPPING

Computer generated speech can be generated for cross-lingual natural language textual data streams by utilizing a universal phoneme set. In a variety of implementations, the natural language textual data stream includes a primary language portion in a primary language and a secondary language portio...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	TAZARI, Siamak, PATEL, Ami
Format:	Patent
Sprache:	eng ; fre
Schlagworte:	ACOUSTICS MUSICAL INSTRUMENTS PHYSICS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	Computer generated speech can be generated for cross-lingual natural language textual data streams by utilizing a universal phoneme set. In a variety of implementations, the natural language textual data stream includes a primary language portion in a primary language and a secondary language portion that is not in the primary language. Phonemes corresponding to the secondary language portion can be determined from a set of phonemes in a universal data set. These phonemes can be mapped back to a set of phonemes for the primary language. Audio data can be generated for these phonemes to pronounce the secondary language portion of the natural language textual data stream utilizing phonemes associated with the primary language. La parole générée par ordinateur peut être générée pour des flux de données textuelles en langage naturel multilingue en utilisant un ensemble de phonèmes universels. Selon une variété de mises en œuvre de l'invention, le flux de données textuelles en langage naturel comprend une partie de langue maternelle dans une langue maternelle et une partie de langue secondaire qui n'est pas dans la langue maternelle. Des phonèmes correspondant à la partie de langue secondaire peuvent être déterminés à partir d'un ensemble de phonèmes dans un ensemble de données universel. Ces phonèmes peuvent être appariés à un ensemble de phonèmes pour la langue maternelle. Des données audio peuvent être générées pour ces phonèmes pour prononcer la partie de langage secondaire du flux de données textuelles en langage naturel à l'aide de phonèmes associés à la langue maternelle.