-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
Graph Neural Networks for Contextual ASR with the Tree-Constrained Pointer Generator
Veröffentlicht in arXiv.org
VolltextArtikel -
9
SkillAggregation: Reference-free LLM-Dependent Aggregation
Veröffentlicht in arXiv.org
VolltextArtikel -
10
-
11
MT2KD: Towards A General-Purpose Encoder for Speech, Speaker, and Audio Events
Veröffentlicht in arXiv.org
VolltextArtikel -
12
-
13
-
14
CrossCheckGPT: Universal Hallucination Ranking for Multimodal Foundation Models
Veröffentlicht in arXiv.org
VolltextArtikel -
15
-
16
Speaker diarisation using 2D self-attentive combination of embeddings
Veröffentlicht in arXiv.org
VolltextArtikel -
17
-
18
-
19
-
20