-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
GEM: A General Evaluation Benchmark for Multimodal Tasks
Veröffentlicht in arXiv.org
VolltextArtikel -
9
M3P: Learning Universal Representations via Multitask Multilingual Multimodal Pre-training
Veröffentlicht in arXiv.org
VolltextArtikel -
10
ImageBERT: Cross-modal Pre-training with Large-scale Weak-supervised Image-Text Data
Veröffentlicht in arXiv.org
VolltextArtikel -
11
-
12
XGPT: Cross-modal Generative Pre-Training for Image Captioning
Veröffentlicht in arXiv.org
VolltextArtikel -
13
XGLUE: A New Benchmark Dataset for Cross-lingual Pre-training, Understanding and Generation
Veröffentlicht in arXiv.org
VolltextArtikel