RESTHT: relation-enhanced spatial–temporal hierarchical transformer for video captioning

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:The Visual computer 2024-04
Hauptverfasser: Zheng, Lihuan, Xu, Wanru, Miao, Zhenjiang, Qiu, Xinxiu, Gong, Shanshan
Format: Artikel
Sprache:eng
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:
ISSN:0178-2789
1432-2315
DOI:10.1007/s00371-024-03350-1