-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
SOK-Bench: A Situated Video Reasoning Benchmark with Aligned Open-World Knowledge
Veröffentlicht in arXiv.org
VolltextArtikel -
10
Embodied Agent Interface: Benchmarking LLMs for Embodied Decision Making
Veröffentlicht in arXiv.org
VolltextArtikel