-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
-
16
-
17
Single-stage TTS with Masked Audio Token Modeling and Semantic Knowledge Distillation
Veröffentlicht in arXiv.org
VolltextArtikel -
18
Measuring the Mixing of Contextual Information in the Transformer
Veröffentlicht in arXiv.org
VolltextArtikel -
19
SpeechAlign: a Framework for Speech Translation Alignment Evaluation
Veröffentlicht in arXiv.org
VolltextArtikel -
20
Pushing the Limits of Zero-shot End-to-End Speech Translation
Veröffentlicht in arXiv.org
VolltextArtikel