-
1
Multi-Span Acoustic Modelling using Raw Waveform Signals
Veröffentlicht in arXiv.org
VolltextArtikel -
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
Distil-Whisper: Robust Knowledge Distillation via Large-Scale Pseudo Labelling
Veröffentlicht in arXiv.org
VolltextArtikel -
10
-
11
ESB: A Benchmark For Multi-Domain End-to-End Speech Recognition
Veröffentlicht in arXiv.org
VolltextArtikel -
12
-
13
-
14
Multi-Task Siamese Neural Network for Improving Replay Attack Detection
Veröffentlicht in arXiv.org
VolltextArtikel -
15
-
16
LCM-LoRA: A Universal Stable-Diffusion Acceleration Module
Veröffentlicht in arXiv.org
VolltextArtikel -
17
-
18
AfroDigits: A Community-Driven Spoken Digit Dataset for African Languages
Veröffentlicht in arXiv.org
VolltextArtikel -
19
-
20
XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale
Veröffentlicht in arXiv.org
VolltextArtikel