-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
PerceptionGPT: Effectively Fusing Visual Perception into LLM
Veröffentlicht in arXiv.org
VolltextArtikel -
13
-
14
-
15
-
16
DetCLIPv3: Towards Versatile Generative Open-vocabulary Object Detection
Veröffentlicht in arXiv.org
VolltextArtikel -
17
-
18
DiT-3D: Exploring Plain Diffusion Transformers for 3D Shape Generation
Veröffentlicht in arXiv.org
VolltextArtikel -
19
PixArt-\Sigma: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation
Veröffentlicht in arXiv.org
VolltextArtikel -
20
DetCLIPv2: Scalable Open-Vocabulary Object Detection Pre-training via Word-Region Alignment
Veröffentlicht in arXiv.org
VolltextArtikel