Reverse Region-to-Entity Annotation for Pixel-Level Visual Entity Linking

Visual Entity Linking (VEL) is a crucial task for achieving fine-grained visual understanding, matching objects within images (visual mentions) to entities in a knowledge base. Previous VEL tasks rely on textual inputs, but writing queries for complex scenes can be challenging. Visual inputs like cl...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	arXiv.org 2024-12
Hauptverfasser:	Xu, Zhengfei, Zhao, Sijia, Yanchao Hao, Liu, Xiaolong, Li, Lili, Yin, Yuyang, Li, Bo, Chen, Xi, Xin, Xin
Format:	Artikel
Sprache:	eng
Schlagworte:	Annotations Attention Datasets Knowledge bases (artificial intelligence) Masks Pixels Semantics Task complexity Visual tasks
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Schreiben Sie den ersten Kommentar!