-
1
Gated Recurrent Attention for Multi-Style Speech Synthesis
Veröffentlicht in Applied sciences
VolltextArtikel -
2
Efficient Parallel Audio Generation Using Group Masked Language Modeling
Veröffentlicht in IEEE signal processing letters
VolltextArtikel -
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
Efficient Parallel Audio Generation using Group Masked Language Modeling
Veröffentlicht in arXiv.org
VolltextArtikel -
16
-
17
-
18
Utilizing Neural Transducers for Two-Stage Text-to-Speech via Semantic Token Prediction
Veröffentlicht in arXiv.org
VolltextArtikel -
19
Latent Filling: Latent Space Data Augmentation for Zero-shot Speech Synthesis
Veröffentlicht in arXiv.org
VolltextArtikel -
20
Into-TTS : Intonation Template Based Prosody Control System
Veröffentlicht in arXiv.org
VolltextArtikel