Improving the adaptive source model for CELP coding with long analysis frame size

One way to lower the coding rate of CELP coders is to lengthen the excitation analysis frame size. For enhanced speech quality in such a case it is desirable to have the CELP excitation peaky (or sharpened). In this paper we first consider the relation between the LPC prediction residual and the CEL...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Speech communication 1995-06, Vol.16 (4), p.423-433
Hauptverfasser: Kwon, C.H., Un, C.K.
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:One way to lower the coding rate of CELP coders is to lengthen the excitation analysis frame size. For enhanced speech quality in such a case it is desirable to have the CELP excitation peaky (or sharpened). In this paper we first consider the relation between the LPC prediction residual and the CELP excitation, and show that the adaptive source of a CELP coder reconstructs the major pulse at glottal closure and the formant structure remained in the LPC residual, and that the stochastic source models the randomness of the LPC residual. Based on this observation, we propose a new adaptive source in which samples of the source have different gains according to their amplitudes by a two-tap pitch predictor. Simulation results show that peaky pulses at voiced onset and a burst of plosive sound are clearly reconstructed, and that in voiced sound the excitation has the desirable peaky pulse characteristic and the pitch periodicity is well reproduced. Eine Möglichkeit die Kodierungsrate eines CELP-Coders zu verringern, besteht in der Verlängerung des Analysefensters der Anregungsparameter. In diesem Fall ist es für eine verbessserte Sprachqualität wünschenswert, die CELP-Anregung zu verschärfen. In diesem Artikel wird zuerst das Verhältnis von der LPC-Voraussage zu der CELP-Anregung betrachtet. Es wird gezeigt, daβ die adaptative Quelle eines CELP-Coders den Hauptimpuls beim Glottisanschlag ansetzt, daβ die Formantstruktur sich innerhalb der LPC-Voraussage bewegt, und daβ die stochastische Quelle die Zufälligkeit der LPC-Voraussage beeinfluβt. Von diesen Beobachtungen ausgehend schlagen wir eine neuartige adaptative Quelle vor, in der die einzelnen Abschnitte der Quelle unterschiedliche Energiewerte haben, je nach der Amplitüde, die das zweipolige Grundfrequenzmodell vorhersagt. Die Ergebnisse von Simulationen haben ergeben, daβ die verstärkten Impulse beim Einsatz der Stimmhaftigkeit und die Explosion bei Verschluβlauten deutlich nachgebildet werden, und daβ für stimmhafte Lauten die gewünschte Impulsverstärkung bei der Anregung und die Periodizität der Grundfrequenz gut realisiert werden. Une façon de réduire le débit des codeurs CELP consiste à rallonger la taille des trames d'analyse de l'excitation. Pour améliorer la qualité de la parole codée, il est souhaitable de restituer l'excitation CELP avec des pics plus marqués. Dans cet article, on étudie d'abord la relation entre le résidu de prédiction LPC et l'excitation CELP. On montre que la source adaptative
ISSN:0167-6393
1872-7182
DOI:10.1016/0167-6393(95)00006-A