Suchergebnisse - LIAO, Hank

1

On Robustness to Missing Video for Audiovisual Speech Recognition von Chang, Oscar, Braga, Otavio, Liao, Hank, Serdyuk, Dmitriy, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

Conformers are All You Need for Visual Speech Recognition von Chang, Oscar, Liao, Hank, Serdyuk, Dmitriy, Shah, Ankit, Siohan, Olivier

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

End-to-End Multi-Person Audio/Visual Automatic Speech Recognition von Braga, Otavio, Makino, Takaki, Siohan, Olivier, Liao, Hank

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

DiarizationLM: Speaker Diarization Post-Processing with Large Language Models von Wang, Quan, Huang, Yiling, Zhao, Guanlong, Clark, Evan, Xia, Wei, Liao, Hank

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

Towards Word-Level End-to-End Neural Speaker Diarization with Auxiliary Network von Huang, Yiling, Wang, Weiran, Zhao, Guanlong, Liao, Hank, Xia, Wei, Wang, Quan

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

USM-SCD: Multilingual Speaker Change Detection Based on Large Pretrained Foundation Models von Zhao, Guanlong, Wang, Yongqiang, Pelecanos, Jason, Zhang, Yu, Liao, Hank, Huang, Yiling, Lu, Han, Wang, Quan

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

Adversarial Training for Multilingual Acoustic Modeling von Hu, Ke, Sak, Hasim, Liao, Hank

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

An audio indexing system for election video material von Alberti, C., Bacchiani, M., Bezman, A., Chelba, C., Drofa, A., Liao, H., Moreno, P., Power, T., Sahuguet, A., Shugrina, M., Siohan, O.

Volltext
Tagungsbericht

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

Neural Language Modeling with Visual Features von Anastasopoulos, Antonios, Kumar, Shankar, Liao, Hank

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

On Robustness to Missing Video for Audiovisual Speech Recognition von Chang, Oscar, Braga, Otavio, Liao, Hank, Serdyuk, Dmitriy, Siohan, Olivier

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

Conformers are All You Need for Visual Speech Recognition von Chang, Oscar, Liao, Hank, Serdyuk, Dmitriy, Shah, Ankit, Siohan, Olivier

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

PRIVACY-AWARE MEETING ROOM TRANSCRIPTION FROM AUDIO-VISUAL STREAM von BRAGA, Otavio, ROSE, Richard, LIAO, Hank, MAKINO, Takaki, SIOHAN, Oliver, CASTILLO, Basilio Garcia

Volltext bestellen

Patent

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

RESCORING AUTOMATIC SPEECH RECOGNITION HYPOTHESES USING AUDIO-VISUAL MATCHING von BRAGA, Otavio, ROSE, Richard, MAKINO, Takaki, LIAO, Hank, SIOHAN, Oliver, GARCIA, Basi

Volltext bestellen

Patent

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

Privacy-aware meeting room transcription from audio-visual stream von Castillo, Basilio Garcia, Siohan, Oliver, Makino, Takaki, Liao, Hank, Braga, Otavio, Rose, Richard

Volltext bestellen

Patent

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

PRIVACY-AWARE MEETING ROOM TRANSCRIPTION FROM AUDIO-VISUAL STREAM von BRAGA, Otavio, ROSE, Richard, LIAO, Hank, MAKINO, Takaki, SIOHAN, Oliver, CASTILLO, Basilio Garcia

Volltext bestellen

Patent

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

DiarizationLM: Speaker Diarization Post-Processing with Large Language Models von Wang, Quan, Huang, Yiling, Zhao, Guanlong, Clark, Evan, Xia, Wei, Liao, Hank

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

Neural Speech Recognizer: Acoustic-to-Word LSTM Model for Large Vocabulary Speech Recognition von Soltau, Hagen, Liao, Hank, Sak, Hasim

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

PRIVACY-AWARE MEETING ROOM TRANSCRIPTION FROM AUDIO-VISUAL STREAM von Castillo, Basilio Garcia, Siohan, Oliver, Makino, Takaki, Liao, Hank, Braga, Otavio, Rose, Richard

Volltext bestellen

Patent

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

End-to-End Multi-Person Audio/Visual Automatic Speech Recognition von Braga, Otavio, Makino, Takaki, Siohan, Olivier, Liao, Hank

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

USM-SCD: Multilingual Speaker Change Detection Based on Large Pretrained Foundation Models von Zhao, Guanlong, Wang, Yongqiang, Pelecanos, Jason, Zhang, Yu, Liao, Hank, Huang, Yiling, Lu, Han, Wang, Quan

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

On Robustness to Missing Video for Audiovisual Speech Recognition von Chang, Oscar, Braga, Otavio, Liao, Hank, Serdyuk, Dmitriy, Siohan, Olivier

Conformers are All You Need for Visual Speech Recognition von Chang, Oscar, Liao, Hank, Serdyuk, Dmitriy, Shah, Ankit, Siohan, Olivier

End-to-End Multi-Person Audio/Visual Automatic Speech Recognition von Braga, Otavio, Makino, Takaki, Siohan, Olivier, Liao, Hank

DiarizationLM: Speaker Diarization Post-Processing with Large Language Models von Wang, Quan, Huang, Yiling, Zhao, Guanlong, Clark, Evan, Xia, Wei, Liao, Hank

Towards Word-Level End-to-End Neural Speaker Diarization with Auxiliary Network von Huang, Yiling, Wang, Weiran, Zhao, Guanlong, Liao, Hank, Xia, Wei, Wang, Quan

USM-SCD: Multilingual Speaker Change Detection Based on Large Pretrained Foundation Models von Zhao, Guanlong, Wang, Yongqiang, Pelecanos, Jason, Zhang, Yu, Liao, Hank, Huang, Yiling, Lu, Han, Wang, Quan

Adversarial Training for Multilingual Acoustic Modeling von Hu, Ke, Sak, Hasim, Liao, Hank

An audio indexing system for election video material von Alberti, C., Bacchiani, M., Bezman, A., Chelba, C., Drofa, A., Liao, H., Moreno, P., Power, T., Sahuguet, A., Shugrina, M., Siohan, O.

Neural Language Modeling with Visual Features von Anastasopoulos, Antonios, Kumar, Shankar, Liao, Hank

On Robustness to Missing Video for Audiovisual Speech Recognition von Chang, Oscar, Braga, Otavio, Liao, Hank, Serdyuk, Dmitriy, Siohan, Olivier

Conformers are All You Need for Visual Speech Recognition von Chang, Oscar, Liao, Hank, Serdyuk, Dmitriy, Shah, Ankit, Siohan, Olivier

PRIVACY-AWARE MEETING ROOM TRANSCRIPTION FROM AUDIO-VISUAL STREAM von BRAGA, Otavio, ROSE, Richard, LIAO, Hank, MAKINO, Takaki, SIOHAN, Oliver, CASTILLO, Basilio Garcia

RESCORING AUTOMATIC SPEECH RECOGNITION HYPOTHESES USING AUDIO-VISUAL MATCHING von BRAGA, Otavio, ROSE, Richard, MAKINO, Takaki, LIAO, Hank, SIOHAN, Oliver, GARCIA, Basi

Privacy-aware meeting room transcription from audio-visual stream von Castillo, Basilio Garcia, Siohan, Oliver, Makino, Takaki, Liao, Hank, Braga, Otavio, Rose, Richard

PRIVACY-AWARE MEETING ROOM TRANSCRIPTION FROM AUDIO-VISUAL STREAM von BRAGA, Otavio, ROSE, Richard, LIAO, Hank, MAKINO, Takaki, SIOHAN, Oliver, CASTILLO, Basilio Garcia

DiarizationLM: Speaker Diarization Post-Processing with Large Language Models von Wang, Quan, Huang, Yiling, Zhao, Guanlong, Clark, Evan, Xia, Wei, Liao, Hank

Neural Speech Recognizer: Acoustic-to-Word LSTM Model for Large Vocabulary Speech Recognition von Soltau, Hagen, Liao, Hank, Sak, Hasim

PRIVACY-AWARE MEETING ROOM TRANSCRIPTION FROM AUDIO-VISUAL STREAM von Castillo, Basilio Garcia, Siohan, Oliver, Makino, Takaki, Liao, Hank, Braga, Otavio, Rose, Richard

End-to-End Multi-Person Audio/Visual Automatic Speech Recognition von Braga, Otavio, Makino, Takaki, Siohan, Olivier, Liao, Hank

USM-SCD: Multilingual Speaker Change Detection Based on Large Pretrained Foundation Models von Zhao, Guanlong, Wang, Yongqiang, Pelecanos, Jason, Zhang, Yu, Liao, Hank, Huang, Yiling, Lu, Han, Wang, Quan

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle