Improving multilingual speech emotion recognition by combining acoustic features in a three-layer model

•We study multilingual speech emotion recognition (mSER) by combined acoustic features in a three-layer perceptual emotion model.•We analyze three vital issues: 1) robust features to mSER; 2) impact of speaker normalization (SN); (3) generalization of mSER to a new language.•Prosody and modulation s...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Speech communication 2019-07, Vol.110, p.1-12
Hauptverfasser: Li, Xingfeng, Akagi, Masato
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!