-
1
-
2
Daisy-TTS: Simulating Wider Spectrum of Emotions via Prosody Embedding Decomposition
Veröffentlicht in arXiv.org
VolltextArtikel -
3
-
4
-
5
-
6
Nix-TTS: Lightweight and End-to-End Text-to-Speech via Module-wise Distillation
Veröffentlicht in arXiv.org
VolltextArtikel -
7
-
8
CVQA: Culturally-diverse Multilingual Visual Question Answering Benchmark
Veröffentlicht in arXiv.org
VolltextArtikel