Suchergebnisse - YAN, Shengen

1

Evaluating Fast Algorithms for Convolutional Neural Networks on FPGAs von Liang, Yun, Lu, Liqiang, Xiao, Qingcheng, Yan, Shengen

Veröffentlicht in IEEE transactions on computer-aided design of integrated circuits and systems

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

DIESEL+: Accelerating Distributed Deep Learning Tasks on Image Datasets von Wang, Lipeng, Luo, Qiong, Yan, Shengen

Veröffentlicht in IEEE transactions on parallel and distributed systems

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

ASTRAEA: A Fair Deep Learning Scheduler for Multi-Tenant GPU Clusters von Ye, Zhisheng, Sun, Peng, Gao, Wei, Zhang, Tianwei, Wang, Xiaolin, Yan, Shengen, Luo, Yingwei

Veröffentlicht in IEEE transactions on parallel and distributed systems

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

Enabling Efficient Fast Convolution Algorithms on GPUs via MegaKernels von Jia, Liancheng, Liang, Yun, Li, Xiuhong, Lu, Liqiang, Yan, Shengen

Veröffentlicht in IEEE transactions on computers

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

NeoFlow: A Flexible Framework for Enabling Efficient Compilation for High Performance DNN Training von Zheng, Size, Chen, Renze, Jin, Yicheng, Wei, Anjiang, Wu, Bingyang, Li, Xiuhong, Yan, Shengen, Liang, Yun

Veröffentlicht in IEEE transactions on parallel and distributed systems

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

GradientFlow: Optimizing Network Performance for Large-Scale Distributed DNN Training von Sun, Peng, Wen, Yonggang, Han, Ruobing, Feng, Wansen, Yan, Shengen

Veröffentlicht in IEEE transactions on big data

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

Parallelization and Performance Optimization on Face Detection Algorithm with OpenCL： A Case Study von Wang, Weiyan, Zhang, Yunquan, Yan, Shengen, Zhang, Ying, Jia, Haipeng

Veröffentlicht in Tsinghua science and technology

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

Proteus: Simulating the Performance of Distributed DNN Training von Duan, Jiangfei, Li, Xiuhong, Xu, Ping, Zhang, Xingcheng, Yan, Shengen, Liang, Yun, Lin, Dahua

Veröffentlicht in IEEE transactions on parallel and distributed systems

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

Characterization and Prediction of Deep Learning Workloads in Large-Scale GPU Datacenters von Hu, Qinghao, Sun, Peng, Shengen Yan, Wen, Yonggang, Zhang, Tianwei

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

A Cross-Platform SpMV Framework on Many-Core Architectures von Zhang, Yunquan, Li, Shigang, Yan, Shengen, Zhou, Huiyang

Veröffentlicht in ACM transactions on architecture and code optimization

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

Towards Distributed Machine Learning in Shared Clusters: A Dynamically-Partitioned Approach von Sun, Peng, Wen, Yonggang, Ta Nguyen Binh Duong, Shengen Yan

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

yaSpMV: yet another SpMV framework on GPUs von Yan, Shengen, Li, Chao, Zhang, Yunquan, Zhou, Huiyang

Veröffentlicht in SIGPLAN notices

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

StreamScan: fast scan algorithms for GPUs without global barrier synchronization von Yan, Shengen, Long, Guoping, Zhang, Yunquan

Veröffentlicht in SIGPLAN notices

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

FrameFusion: Combining Similarity and Importance for Video Token Reduction on Large Visual Language Models von Fu, Tianyu, Liu, Tengxuan, Han, Qinghao, Dai, Guohao, Yan, Shengen, Yang, Huazhong, Ning, Xuefei, Wang, Yu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

Parallelization strategy optimization method, system, device and medium von YAN SHENGEN

Volltext bestellen

Patent

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

General matrix multiplication optimization method, system, equipment and medium von YAN SHENGEN

Volltext bestellen

Patent

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling von Yuan, Zhihang, Shang, Yuzhang, Zhang, Hanling, Fang, Tongcheng, Xie, Rui, Xu, Bingxin, Yan, Yan, Yan, Shengen, Dai, Guohao, Wang, Yu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

CSKV: Training-Efficient Channel Shrinking for KV Cache in Long-Context Scenarios von Wang, Luning, Li, Shiyao, Ning, Xuefei, Yuan, Zhihang, Yan, Shengen, Dai, Guohao, Wang, Yu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

A Simulation Platform for Multi-tenant Machine Learning Services on Thousands of GPUs von Liang, Ruofan, He, Bingsheng, Yan, Shengen, Sun, Peng

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

Efficient Expert Pruning for Sparse Mixture-of-Experts Language Models: Enhancing Performance and Reducing Inference Costs von Liu, Enshu, Zhu, Junyi, Lin, Zinan, Ning, Xuefei, Blaschko, Matthew B, Yan, Shengen, Dai, Guohao, Yang, Huazhong, Wang, Yu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

Evaluating Fast Algorithms for Convolutional Neural Networks on FPGAs von Liang, Yun, Lu, Liqiang, Xiao, Qingcheng, Yan, Shengen

DIESEL+: Accelerating Distributed Deep Learning Tasks on Image Datasets von Wang, Lipeng, Luo, Qiong, Yan, Shengen

ASTRAEA: A Fair Deep Learning Scheduler for Multi-Tenant GPU Clusters von Ye, Zhisheng, Sun, Peng, Gao, Wei, Zhang, Tianwei, Wang, Xiaolin, Yan, Shengen, Luo, Yingwei

Enabling Efficient Fast Convolution Algorithms on GPUs via MegaKernels von Jia, Liancheng, Liang, Yun, Li, Xiuhong, Lu, Liqiang, Yan, Shengen

NeoFlow: A Flexible Framework for Enabling Efficient Compilation for High Performance DNN Training von Zheng, Size, Chen, Renze, Jin, Yicheng, Wei, Anjiang, Wu, Bingyang, Li, Xiuhong, Yan, Shengen, Liang, Yun

GradientFlow: Optimizing Network Performance for Large-Scale Distributed DNN Training von Sun, Peng, Wen, Yonggang, Han, Ruobing, Feng, Wansen, Yan, Shengen

Parallelization and Performance Optimization on Face Detection Algorithm with OpenCL： A Case Study von Wang, Weiyan, Zhang, Yunquan, Yan, Shengen, Zhang, Ying, Jia, Haipeng

Proteus: Simulating the Performance of Distributed DNN Training von Duan, Jiangfei, Li, Xiuhong, Xu, Ping, Zhang, Xingcheng, Yan, Shengen, Liang, Yun, Lin, Dahua

Characterization and Prediction of Deep Learning Workloads in Large-Scale GPU Datacenters von Hu, Qinghao, Sun, Peng, Shengen Yan, Wen, Yonggang, Zhang, Tianwei

A Cross-Platform SpMV Framework on Many-Core Architectures von Zhang, Yunquan, Li, Shigang, Yan, Shengen, Zhou, Huiyang

Towards Distributed Machine Learning in Shared Clusters: A Dynamically-Partitioned Approach von Sun, Peng, Wen, Yonggang, Ta Nguyen Binh Duong, Shengen Yan

yaSpMV: yet another SpMV framework on GPUs von Yan, Shengen, Li, Chao, Zhang, Yunquan, Zhou, Huiyang

StreamScan: fast scan algorithms for GPUs without global barrier synchronization von Yan, Shengen, Long, Guoping, Zhang, Yunquan

FrameFusion: Combining Similarity and Importance for Video Token Reduction on Large Visual Language Models von Fu, Tianyu, Liu, Tengxuan, Han, Qinghao, Dai, Guohao, Yan, Shengen, Yang, Huazhong, Ning, Xuefei, Wang, Yu

Parallelization strategy optimization method, system, device and medium von YAN SHENGEN

General matrix multiplication optimization method, system, equipment and medium von YAN SHENGEN

E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling von Yuan, Zhihang, Shang, Yuzhang, Zhang, Hanling, Fang, Tongcheng, Xie, Rui, Xu, Bingxin, Yan, Yan, Yan, Shengen, Dai, Guohao, Wang, Yu

CSKV: Training-Efficient Channel Shrinking for KV Cache in Long-Context Scenarios von Wang, Luning, Li, Shiyao, Ning, Xuefei, Yuan, Zhihang, Yan, Shengen, Dai, Guohao, Wang, Yu

A Simulation Platform for Multi-tenant Machine Learning Services on Thousands of GPUs von Liang, Ruofan, He, Bingsheng, Yan, Shengen, Sun, Peng

Efficient Expert Pruning for Sparse Mixture-of-Experts Language Models: Enhancing Performance and Reducing Inference Costs von Liu, Enshu, Zhu, Junyi, Lin, Zinan, Ning, Xuefei, Blaschko, Matthew B, Yan, Shengen, Dai, Guohao, Yang, Huazhong, Wang, Yu

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle