SPEECH ENHANCEMENT TECHNIQUES ON THE POWER SPECTRUM

The method provides a spectral speech description to be used for synthesis of a speech utterance, where at least one spectral envelope input representation is received. In one solution the improvement is made by manipulation an extremum, i.e. a peak or a valley, in the rapidly varying component of t...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: COORMAN, GEERT, WOUTERS, JOHAN
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The method provides a spectral speech description to be used for synthesis of a speech utterance, where at least one spectral envelope input representation is received. In one solution the improvement is made by manipulation an extremum, i.e. a peak or a valley, in the rapidly varying component of the spectral envelope representation. The rapidly varying component of the spectral envelope representation is manipulated to sharpen and/or accentuate extrema after which it is merged back with the slowly varying component or the spectral envelope input representation to create an enhanced spectral envelope final representation. In other solutions a complex spectrum envelope final representation is created with phase information derived from one of the group delay representation of a real spectral envelope input representation corresponding to a short-time speech signal and a transformed phase component of the discrete complex frequency domain input representation corresponding to the speech utterance. Cette invention concerne une description du spectre de la parole à utiliser pour réaliser la synthèse d'un énoncé vocal, avec réception d'au moins une représentation d'une entrée d'enveloppe spectrale. Dans un mode de réalisation, l'amélioration s'obtient en manipulant un extrême, c'est-à-dire soit une crête, soit un creux, de la composante à variation rapide de la représentation de l'enveloppe spectrale. Cette manipulation a pour effet d'accentuer et/ou d'intensifier les extrêmes, à la suite de quoi la composante à variation rapide de la représentation de l'enveloppe spectrale est réintégrée avec la composante à variation lente de cette même enveloppe, le but étant de créer une représentation finale améliorée de ladite enveloppe. Dans d'autres modes de réalisation, une représentation finale d'enveloppe spectrale complexe est créée avec des informations de phase dérivées de l'une des représentations de groupe différées d'une représentation d'entrée d'enveloppe spectrale réelle correspondant à un signal vocal de courte durée et une composante de phase transformée d'une représentation d'entrée à domaine de fréquence complexe discret correspondant à l'énoncé vocal.