-
1
-
2
-
3
-
4
Enabling Efficient Fast Convolution Algorithms on GPUs via MegaKernels
Veröffentlicht in IEEE transactions on computers
VolltextArtikel -
5
-
6
-
7
-
8
-
9
Characterization and Prediction of Deep Learning Workloads in Large-Scale GPU Datacenters
Veröffentlicht in arXiv.org
VolltextArtikel -
10
-
11
Towards Distributed Machine Learning in Shared Clusters: A Dynamically-Partitioned Approach
Veröffentlicht in arXiv.org
VolltextArtikel -
12
-
13
StreamScan: fast scan algorithms for GPUs without global barrier synchronization
Veröffentlicht in SIGPLAN notices
VolltextArtikel -
14
-
15
-
16
-
17
-
18
-
19
-
20