Harmonic coding - state of the art and future trends
The recent research trend towards the use of harmonies/sinusoid based methods, in order to exploit the fine spectral structure of voiced speech, cannot be questioned. This paper discusses the state of the art in this area, both in terms of analysis-synthesis methods and of their application to codin...
Gespeichert in:
Veröffentlicht in: | Speech communication 1988-07, Vol.7 (2), p.239-245 |
---|---|
Hauptverfasser: | , , , , |
Format: | Artikel |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | The recent research trend towards the use of harmonies/sinusoid based methods, in order to exploit the fine spectral structure of voiced speech, cannot be questioned. This paper discusses the state of the art in this area, both in terms of analysis-synthesis methods and of their application to coding. The key points are:
•
- Harmonic modelling is a very efficient tool for voiced regions, producing synthetic speech of very high quality, but being simultaneously prone to pitch and voicing errors. The main disadvantage of harmonic coding is the need for an alternative method for unvoiced regions. ATC is a natural choice. In this paper, an 8 kbit/s simulation is presented, using hard switching between harmonic coding and ATC.
•
- Sinusoid based modelling extends the basic analysis-synthesis framework to unvoiced and transition regions, by removing the constraint that the sinusoids be harmonically related. When it comes to coding, however, it still has many unsolved problems.
As a conclusion, some guidelines for future research are discussed.
Fraglos besteht eine interessante Forschungsrichtung darin, die spektrale Feinstruktur stimmhafter Sprache mit Methoden auf der Grundlage harmonischer oder sinusförmiger Modelle auszunützen. Im folgenden Aufsatz wird der Wissensstand auf diesem Gebeit diskutiert, und zwar sowohl hinsichtlich der zugrundeliegenden Analyse-Synthese Verfahren als auch bezüglich der Anwendung zur Sprachkodierung. Die Kernpunkte sind die folgenden:
•
- Harmonische Kodierung ist ein sehr wirksames Werkzeug für stimmhafte Abschnitte und liefert eine synthetisierte Sprache sehr hoher Qualität, ist jedoch gleichzeitig anfällig gegenüber Fehlern bei der Stimmhaft-Stimmlos Entscheidung und der Pitcherkennung. Der Hauptnachteil der harmonischen Kodierung besteht in der Notwendigkeit eines anderen Kodieransatzes für stimmlose Abschnitte. Hier ist ATC eine natürliche Wahl. Im vorliegenden Bericht wird die Simulation einer 8 kbit/s Version vorgestellt, bei der zwischen harmonischer Kodierung und ATC hart umgeschaltet wird.
•
- Sinusmodellierung erweitert den ursprünglichen Rahmen der Analyse und Synthese auf Abschnitte, die stimmlos sind oder Übergänge enthalten, indem die Bedingung fallengelassen wird, dass die beteiligten Sinusanteile zueinander harmonisch zu sein haben. In der praktischen Anwendung bei der Kodierung treten jedoch noch viele ungelöste Probleme auf.
Zum Schluss werden einige Zielrichtungen künftiger Forsc |
---|---|
ISSN: | 0167-6393 1872-7182 |
DOI: | 10.1016/0167-6393(88)90043-X |