-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
-
16
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration
Veröffentlicht in arXiv.org
VolltextArtikel -
17
-
18
-
19
Variator: Accelerating Pre-trained Models with Plug-and-Play Compression Modules
Veröffentlicht in arXiv.org
VolltextArtikel -
20