Suchergebnisse - Siohan, Olivier

1

A Closer Look at Audio-Visual Multi-Person Speech Recognition and Active Speaker Selection von Braga, Otavio, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

Best of Both Worlds: Multi-task Audio-Visual Automatic Speech Recognition and Active Speaker Detection von Braga, Otavio, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

End-to-end multi-talker audio-visual ASR using an active speaker attention module von Rose, Richard, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

Revisiting the Entropy Semiring for Neural Speech Recognition von Chang, Oscar, Hwang, Dongseong, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

Cascaded encoders for fine-tuning ASR models on overlapped speech von Rose, Richard, Chang, Oscar, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

Comments on Vocal Tract Length Normalization Equals Linear Transformation in Cepstral Space von Afify, M., Siohan, O.

Veröffentlicht in IEEE transactions on audio, speech, and language processing

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

On Robustness to Missing Video for Audiovisual Speech Recognition von Chang, Oscar, Braga, Otavio, Liao, Hank, Serdyuk, Dmitriy, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

Transformer-Based Video Front-Ends for Audio-Visual Speech Recognition for Single and Multi-Person Video von Serdyuk, Dmitriy, Braga, Otavio, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

$Audio-Visual Speech Recognition is Worth 32$\times$32$\times$8 Voxels$

Audio-Visual Speech Recognition is Worth 32$\times$32$\times$8 Voxels von Serdyuk, Dmitriy, Braga, Otavio, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

A Closer Look at Audio-Visual Multi-Person Speech Recognition and Active Speaker Selection von Braga, Otavio, Siohan, Olivier

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

Best of Both Worlds: Multi-task Audio-Visual Automatic Speech Recognition and Active Speaker Detection von Braga, Otavio, Siohan, Olivier

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

Conformers are All You Need for Visual Speech Recognition von Chang, Oscar, Liao, Hank, Serdyuk, Dmitriy, Shah, Ankit, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

End-to-end multi-talker audio-visual ASR using an active speaker attention module von Rose, Richard, Siohan, Olivier

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

End-to-End Multi-Person Audio/Visual Automatic Speech Recognition von Braga, Otavio, Makino, Takaki, Siohan, Olivier, Liao, Hank

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

Audio-visual fine-tuning of audio-only ASR models von May, Avner, Serdyuk, Dmitriy, Shah, Ankit Parag, Braga, Otavio, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

Constructing ensembles of ASR systems using randomized decision trees von Siohan, O., Ramabhadran, B., Kingsbury, B.

Volltext
Tagungsbericht

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

Revisiting the Entropy Semiring for Neural Speech Recognition von Chang, Oscar, Hwang, Dongseong, Siohan, Olivier

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

An audio indexing system for election video material von Alberti, C., Bacchiani, M., Bezman, A., Chelba, C., Drofa, A., Liao, H., Moreno, P., Power, T., Sahuguet, A., Shugrina, M., Siohan, O.

Volltext
Tagungsbericht

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

Structural maximum a posteriori linear regression for fast HMM adaptation von Siohan, Olivier, Myrvoll, Tor André, Lee, Chin-Hui

Veröffentlicht in Computer speech & language

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

Cascaded encoders for fine-tuning ASR models on overlapped speech von Rose, Richard, Chang, Oscar, Siohan, Olivier

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

A Closer Look at Audio-Visual Multi-Person Speech Recognition and Active Speaker Selection von Braga, Otavio, Siohan, Olivier

Best of Both Worlds: Multi-task Audio-Visual Automatic Speech Recognition and Active Speaker Detection von Braga, Otavio, Siohan, Olivier

End-to-end multi-talker audio-visual ASR using an active speaker attention module von Rose, Richard, Siohan, Olivier

Revisiting the Entropy Semiring for Neural Speech Recognition von Chang, Oscar, Hwang, Dongseong, Siohan, Olivier

Cascaded encoders for fine-tuning ASR models on overlapped speech von Rose, Richard, Chang, Oscar, Siohan, Olivier

Comments on Vocal Tract Length Normalization Equals Linear Transformation in Cepstral Space von Afify, M., Siohan, O.

On Robustness to Missing Video for Audiovisual Speech Recognition von Chang, Oscar, Braga, Otavio, Liao, Hank, Serdyuk, Dmitriy, Siohan, Olivier

Transformer-Based Video Front-Ends for Audio-Visual Speech Recognition for Single and Multi-Person Video von Serdyuk, Dmitriy, Braga, Otavio, Siohan, Olivier

Audio-Visual Speech Recognition is Worth 32$\times$32$\times$8 Voxels von Serdyuk, Dmitriy, Braga, Otavio, Siohan, Olivier

A Closer Look at Audio-Visual Multi-Person Speech Recognition and Active Speaker Selection von Braga, Otavio, Siohan, Olivier

Best of Both Worlds: Multi-task Audio-Visual Automatic Speech Recognition and Active Speaker Detection von Braga, Otavio, Siohan, Olivier

Conformers are All You Need for Visual Speech Recognition von Chang, Oscar, Liao, Hank, Serdyuk, Dmitriy, Shah, Ankit, Siohan, Olivier

End-to-end multi-talker audio-visual ASR using an active speaker attention module von Rose, Richard, Siohan, Olivier

End-to-End Multi-Person Audio/Visual Automatic Speech Recognition von Braga, Otavio, Makino, Takaki, Siohan, Olivier, Liao, Hank

Audio-visual fine-tuning of audio-only ASR models von May, Avner, Serdyuk, Dmitriy, Shah, Ankit Parag, Braga, Otavio, Siohan, Olivier

Constructing ensembles of ASR systems using randomized decision trees von Siohan, O., Ramabhadran, B., Kingsbury, B.

Revisiting the Entropy Semiring for Neural Speech Recognition von Chang, Oscar, Hwang, Dongseong, Siohan, Olivier

An audio indexing system for election video material von Alberti, C., Bacchiani, M., Bezman, A., Chelba, C., Drofa, A., Liao, H., Moreno, P., Power, T., Sahuguet, A., Shugrina, M., Siohan, O.

Structural maximum a posteriori linear regression for fast HMM adaptation von Siohan, Olivier, Myrvoll, Tor André, Lee, Chin-Hui

Cascaded encoders for fine-tuning ASR models on overlapped speech von Rose, Richard, Chang, Oscar, Siohan, Olivier

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle