CLIP-Powered TASS: Target-Aware Single-Stream Network for Audio-Visual Question Answering

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:International journal of computer vision 2024-12
Hauptverfasser: Jiang, Yuanyuan, Yin, Jianqin
Format: Artikel
Sprache:eng
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:
ISSN:0920-5691
1573-1405
DOI:10.1007/s11263-024-02289-z