CLIP-Powered TASS: Target-Aware Single-Stream Network for Audio-Visual Question Answering

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	International journal of computer vision 2024-12
Hauptverfasser:	Jiang, Yuanyuan, Yin, Jianqin
Format:	Artikel
Sprache:	eng
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!