-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
A Closer Look at Audio-Visual Multi-Person Speech Recognition and Active Speaker Selection
Veröffentlicht in arXiv.org
VolltextArtikel -
11
-
12
-
13
End-to-end multi-talker audio-visual ASR using an active speaker attention module
Veröffentlicht in arXiv.org
VolltextArtikel -
14
-
15
-
16
-
17
Revisiting the Entropy Semiring for Neural Speech Recognition
Veröffentlicht in arXiv.org
VolltextArtikel -
18
-
19
Structural maximum a posteriori linear regression for fast HMM adaptation
Veröffentlicht in Computer speech & language
VolltextArtikel -
20
Cascaded encoders for fine-tuning ASR models on overlapped speech
Veröffentlicht in arXiv.org
VolltextArtikel