-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
VILAS: Exploring the Effects of Vision and Language Context in Automatic Speech Recognition
Veröffentlicht in arXiv.org
VolltextArtikel -
13
NEST-RQ: Next Token Prediction for Speech Self-Supervised Pre-Training
Veröffentlicht in arXiv.org
VolltextArtikel -
14
-
15
Matching-based Term Semantics Pre-training for Spoken Patient Query Understanding
Veröffentlicht in arXiv.org
VolltextArtikel -
16
-
17
CIF-based Collaborative Decoding for End-to-end Contextual Speech Recognition
Veröffentlicht in arXiv.org
VolltextArtikel -
18
-
19
Seed-ASR: Understanding Diverse Speech and Contexts with LLM-based Speech Recognition
Veröffentlicht in arXiv.org
VolltextArtikel -
20