-
1
-
2
-
3
-
4
CAD -- Contextual Multi-modal Alignment for Dynamic AVQA
Veröffentlicht in arXiv.org
VolltextArtikel -
5
SEM-POS: Grammatically and Semantically Correct Video Captioning
Veröffentlicht in arXiv.org
VolltextArtikel