-
1
-
2
-
3
-
4
-
5
-
6
Duo-LLM: A Framework for Studying Adaptive Computation in Large Language Models
Veröffentlicht in arXiv.org
VolltextArtikel -
7
LLM in a flash: Efficient Large Language Model Inference with Limited Memory
Veröffentlicht in arXiv.org
VolltextArtikel -
8
OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework
Veröffentlicht in arXiv.org
VolltextArtikel -
9
-
10
-
11
-
12
-
13