A study of harmonic features for the speaker recognition
In this paper the harmonic features based on the harmonic decomposition of the Hildebrand–Prony line spectrum are introduced. A Hildebrand–Prony method of spectral analysis was applied because of its high resolution and accuracy. Comparative tests with the LP and LP-cepstral features were made with...
Gespeichert in:
Veröffentlicht in: | Speech communication 1997, Vol.22 (4), p.385-402 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | In this paper the
harmonic features based on the harmonic decomposition of the Hildebrand–Prony line spectrum are introduced. A Hildebrand–Prony method of spectral analysis was applied because of its high resolution and accuracy. Comparative tests with the LP and LP-cepstral features were made with 50 speakers from the Slovene database SNABI (isolated words corpus) and 50 speakers of the German database BAS Siemens 100 (utterances of sentences). With both databases the advantages of the harmonic features were noticed especially for the speaker identification while for the speaker verification the harmonic features have performed better on the SNABI database and as good as the LP cepstral features on the BAS Siemens 100 database.
In diesem Artikel werden harmonische Eigenschaften, basierend auf einer harmonischen Dekomposition des Hildebrand–Prony Linienspektrums eingeleited. Wegen ihrer Standhaftigkeit und Genauigkeit wurde die Hildebrand–Prony-Methode verwendet. Mit 50 Sprechern aus der slowenischen Datenbank SNABI (isolierte Wortstämme) und 50 Sprechern aus der deutschen Datenbank BAS Siemens 100 (Satzaussprachen) wurden komparative Tests mit LP und LP-cepstralen Eigenschaften durchgeführt. Bei beiden Datenbank wurden Vorteile der harmonischen Eigenschaften erkannt, vor allem bei der Sprechererkennung, wobei die harmonischen Eigenschaften auf der SNABI Datenbank für die Verifizierung der Sprecher leistungsfähiger waren und auf der Datenbank BAS Siemens 100 genau so gut wie die LP-cepstrale Eigenschaften.
Cet article présente une méthode basée sur la décomposition harmonique du spectre de Hildebrand–Prony. Cette analyse spectrale de Hildebrand–Prony est appliquée pour sa haute résolution et sa précision. Des tests comparatifs avec des indices LP et LP-cepstraux ont été réalisés sur 50 sujets provenant de la base de données slovène SNABI (corpus de mots isolés) et sur 50 sujets allemands provenant de la base de données BAS Siemens 100 (phrases). Sur ces deux bases de données les avantages des indices harmonique ont été observés surtout pour l'identification des locuteurs. Pour la vérification des locuteurs, les indices harmoniques donnent des résultats meilleurs sur la base de données SNABI et aussi bons que les indices LP-cepstraux sur la base de données BAS Siemens 100. |
---|---|
ISSN: | 0167-6393 1872-7182 |
DOI: | 10.1016/S0167-6393(97)00053-8 |