MV-CLIP: Multi-View CLIP for Zero-shot 3D Shape Recognition

Large-scale pre-trained models have demonstrated impressive performance in vision and language tasks within open-world scenarios. Due to the lack of comparable pre-trained models for 3D shapes, recent methods utilize language-image pre-training to realize zero-shot 3D shape recognition. However, due...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	arXiv.org 2024-09
Hauptverfasser:	Song, Dan, Fu, Xinwei, Liu, Ning, Nie, Weizhi, Li, Wenhui, Wang, Lanjun, Yang, You, Liu, Anan
Format:	Artikel
Sprache:	eng
Schlagworte:	Classification Descriptions Shape recognition Three dimensional models Training
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Schreiben Sie den ersten Kommentar!