Audio signal coding method for speech or music signals

The audio signals are reduced in relation to their perceptual irrelevance by transformation in a two-dimensional process using a frequency or tonotopic axis, a time axis and an intensity axis, correlated with human hearing sensitivity, to produce a signal representation in a perceptual space in whic...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	KUROPATWINSKI, MARCIN, LECKSCHAT, DIETER
Format:	Patent
Sprache:	eng ; ger
Schlagworte:	ACOUSTICS MUSICAL INSTRUMENTS PHYSICS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	The audio signals are reduced in relation to their perceptual irrelevance by transformation in a two-dimensional process using a frequency or tonotopic axis, a time axis and an intensity axis, correlated with human hearing sensitivity, to produce a signal representation in a perceptual space in which all similarly sounding audio signals are mapped to the same element. The mean square distance between the elements of the space, designated as "internal representations", correspond to the aurally perceived difference between the audio signals. The audio signals transformed into "internal representations" are encoded in further processing in a channel encoder, using methods based on "rate distortion theory" in which the mean square error is used as a measure of disturbance, as is the case for image or video encoding. Um beim Kodieren von Audiosignalen die Kodierungseffizienz zu erhöhen bzw. zu steigern, wird das Audiosignal zuerst in die eine Form transformiert, die mit dem Empfinden des Audiosignals durch das Gehör des Menschen korreliert ist. Danach wird eine Kodierung im Sinne der "Rate-Distortion-Theorie" durchgeführt, die den mittleren quadratischen Fehler zwischen der "Internen Repräsentation" des Eingangssignals und der "Internen Repräsentation" des dekodierten Signals bei gegebener Bitrate minimiert. Die Kodierung der Audiosignale erfolgt also in zwei Verfahrensschritten: zuerst die Berechnung der entsprechenden Signalrepräsentation in der perzeptualen Domäne und dann die Kodierung, die die statistische Redundanz zur Senkung der Bitrate ausnutzt.