Verfahren und System zur Sprachsyntheseeinheitenauswahl
Nichttransitorisches Computerspeichermedium, das mit Anweisungen codiert ist, die dann, wenn sie durch einen oder mehrere Computer eines Text-zu-Sprache-Systems (116) ausgeführt werden, bewirken, dass der eine oder die mehreren Computer Operationen ausführen, die umfassen:Empfangen (302) durch den e...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Patent |
Sprache: | ger |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Nichttransitorisches Computerspeichermedium, das mit Anweisungen codiert ist, die dann, wenn sie durch einen oder mehrere Computer eines Text-zu-Sprache-Systems (116) ausgeführt werden, bewirken, dass der eine oder die mehreren Computer Operationen ausführen, die umfassen:Empfangen (302) durch den einen oder die mehreren Computer des Text-zu-Sprache-Systems von Daten, die Text zur Sprachsynthese angeben;Bestimmen (304) durch den einen oder die mehreren Computer des Text-zu-Sprache-Systems einer Folge von Texteinheiten, die jeweils einen jeweiligen Abschnitt des Texts repräsentieren, wobei die Folge von Texteinheiten wenigstens eine erste Texteinheit gefolgt von einer zweiten Texteinheit enthält;Bestimmen (306) durch den einen oder die mehreren Computer des Text-zu-Sprache-Systems mehrerer Pfade von Spracheinheiten, die jeweils die Folge von Texteinheiten repräsentieren, wobei das Bestimmen der mehreren Pfade von Spracheinheiten umfasst:Auswählen (308) aus einem Spracheinheitenkörper (124) einer vorbestimmten Menge L erster Spracheinheiten (202a-202f), die Sprachsynthesedaten umfassen, die die erste Texteinheit repräsentieren; undDefinieren von Pfaden für eine vorbestimmte Anzahl K (202a-202c) der vorbestimmten Menge L der ersten Spracheinheiten (202a-202f) durch:Auswählen (310), für jede erste Spracheinheit der vorbestimmten Anzahl K (202a-202c) der vorbestimmten Menge L der ersten Spracheinheiten (202a-202f), einer vorbestimmten Anzahl größer eins von zweiten Spracheinheiten (204a-204b, 204c-204d, 204e-204f), die Sprachsynthesedaten umfassen, die die zweite Texteinheit repräsentieren, aus dem Spracheinheitenkörper (124), wobei jede zweite Spracheinheit der vorbestimmten Anzahl größer eins von zweiten Spracheinheiten (204a-204b, 204c-204d, 204e-204f) basierend auf (i) einem Verknüpfungsaufwand, um die zweite Spracheinheit mit der jeweiligen ersten Spracheinheit zu verketten, und (ii) einem Zielaufwand, der einen Grad dafür angibt, dass die zweite Spracheinheit der zweiten Texteinheit entspricht, bestimmt wird; undDefinieren (314) von Pfaden von jeder der ersten Spracheinheiten der vorbestimmten Anzahl K (202a-202c) der vorbestimmten Menge L der ersten Spracheinheiten (202a-202f) zu jeder zweiten Spracheinheit der jeweiligen vorbestimmten Anzahl größer eins von zweiten Spracheinheiten (204a-204b, 204c-204d, 204e-204f), die in die mehreren Pfade von Spracheinheiten aufgenommen werden sollen, wobei zu Pfaden, die eine in der vorbestimmten Menge L der ersten S |
---|