HARMONIC ADAPTIVE SPEECH CODING METHOD AND SYSTEM

A method and system is provided for encoding and decoding of speech signals at a low bit rate. The continuous input speech (15) is divided into voiced and unvoiced time segments of a predetermined length. The encoder of the system (100) uses a linear predictive coding model for the unvoiced speech s...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	AGUILAR, JOSEPH, G
Format:	Patent
Sprache:	eng ; fre
Schlagworte:	ACOUSTICS MUSICAL INSTRUMENTS PHYSICS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	A method and system is provided for encoding and decoding of speech signals at a low bit rate. The continuous input speech (15) is divided into voiced and unvoiced time segments of a predetermined length. The encoder of the system (100) uses a linear predictive coding model for the unvoiced speech segments and harmonic frequencies decomposition for the voiced speech segment. Only the harmonic frequencies are determined using the discrete fourier transform of the voiced speech segments. The decoder (400) synthesizes voice speech segments using the magnitudes of the transmitted harmonics and estimates the phase of each harmonic from the signal in the preceeding speech segments. Unvoiced speech segments are synthesized using linear prediction coding coefficients obtained from codebook entries for the poles of the LPC coefficient polynomial. Boundary conditions between voiced and unvoiced segments are established to insure amplitude and phase continuity for improved output speech quality. Système et procédé de codage et décodage de signaux vocaux à un débit binaire faible. La voix d'entrée continue (15) est divisée en segments temporels vocaux et non vocaux d'une longueur prédéterminée. Le codeur du système (100) utilise un modèle de codage prédictif linéaire pour les segments non vocaux et la décomposition de fréquences harmoniques pour les segments vocaux. Seules les fréquences harmoniques sont déterminées à l'aide de la transformation de Fourier discrète des segments vocaux. Le décodeur (400) synthétise les segments vocaux à l'aide des amplitudes des harmoniques émises et évalue la phase de chaque harmonique à partir du signal des segments vocaux précédents. Les segments non vocaux sont synthétisés à l'aide de coefficients de codage à prévision linéaire obtenus à partir des entrées des tables de codes pour les pôles du polinôme à coefficients de codage à prévision linéaire. Des états limites sont établis entre les segments vocaux et non vocaux pour assurer l'amplitude et la continuité de phase et obtenir une meilleure qualité vocale de sortie.