-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows
Veröffentlicht in arXiv.org
VolltextArtikel -
12
BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval
Veröffentlicht in arXiv.org
VolltextArtikel -
13
Lemur: Harmonizing Natural Language and Code for Language Agents
Veröffentlicht in arXiv.org
VolltextArtikel -
14
One Embedder, Any Task: Instruction-Finetuned Text Embeddings
Veröffentlicht in arXiv.org
VolltextArtikel -
15
OpenAgents: An Open Platform for Language Agents in the Wild
Veröffentlicht in arXiv.org
VolltextArtikel -
16
Selective Annotation Makes Language Models Better Few-Shot Learners
Veröffentlicht in arXiv.org
VolltextArtikel -
17
-
18
-
19
-
20