Suchergebnisse - Zhang, Li Lyna

1

nn-METER: Towards Accurate Latency Prediction of DNN Inference on Diverse Edge Devices von Zhang, Li Lyna, Han, Shihao, Wei, Jianyu, Zheng, Ningxin, Cao, Ting, Liu, Yunxin

Veröffentlicht in GetMobile (New York, N.Y.)

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

Constraint-aware and Ranking-distilled Token Pruning for Efficient Transformer Inference von Li, Junyan, Li Lyna Zhang, Xu, Jiahang, Wang, Yujing, Yan, Shaoguang, Xia, Yunqing, Yang, Yuqing, Cao, Ting, Sun, Hao, Deng, Weiwei, Zhang, Qi, Mao, Yang

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

PruneAug: Bridging DNN Pruning and Inference Latency on Diverse Sparse Platforms Using Automatic Layerwise Block Pruning von Geng, Hanfei, Liu, Yifei, Zheng, Yujie, Zhang, Li Lyna, Sun, Jingwei, Wang, Yujing, Wang, Yang, Sun, Guangzhong, Yang, Mao, Cao, Ting, Liu, Yunxin

Veröffentlicht in IEEE transactions on computers

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers von Qi, Zhenting, Ma, Mingyuan, Xu, Jiahang, Zhang, Li Lyna, Yang, Fan, Yang, Mao

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

Compresso: Structured Pruning with Collaborative Prompting Learns Compact Large Language Models von Guo, Song, Xu, Jiahang, Zhang, Li Lyna, Yang, Mao

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

Fewer is More: Boosting LLM Reasoning with Reinforced Context Pruning von Huang, Xijie, Zhang, Li Lyna, Cheng, Kwang-Ting, Yang, Fan, Yang, Mao

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

SwiftPruner: Reinforced Evolutionary Pruning for Efficient Ad Relevance von Zhang, Li Lyna, Homma, Youkow, Wang, Yujing, Wu, Min, Yang, Mao, Zhang, Ruofei, Cao, Ting, Shen, Wei

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

Fast Hardware-Aware Neural Architecture Search von Zhang, Li Lyna, Yang, Yuqing, Jiang, Yuhang, Zhu, Wenwu, Liu, Yunxin

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking von Guan, Xinyu, Zhang, Li Lyna, Liu, Yifei, Shang, Ning, Sun, Youran, Zhu, Yi, Yang, Fan, Yang, Mao

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models von Liu, Yifei, Wen, Jicheng, Wang, Yang, Ye, Shengyu, Zhang, Li Lyna, Cao, Ting, Li, Cheng, Yang, Mao

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens von Ding, Yiran, Zhang, Li Lyna, Zhang, Chengruidong, Xu, Yuanyuan, Shang, Ning, Xu, Jiahang, Yang, Fan, Yang, Mao

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

ElasticViT: Conflict-aware Supernet Training for Deploying Fast Vision Transformer on Diverse Mobile Devices von Tang, Chen, Zhang, Li Lyna, Jiang, Huiqiang, Xu, Jiahang, Cao, Ting, Zhang, Quanlu, Yang, Yuqing, Wang, Zhi, Yang, Mao

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

SpaceEvo: Hardware-Friendly Search Space Design for Efficient INT8 Inference von Zhang, Li Lyna, Wang, Xudong, Xu, Jiahang, Zhang, Quanlu, Wang, Yujing, Yang, Yuqing, Zheng, Ningxin, Cao, Ting, Yang, Mao

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

Boosting Mobile CNN Inference through Semantic Memory von Li, Yun, Zhang, Chen, Han, Shihao, Zhang, Li Lyna, Yin, Baoqun, Liu, Yunxin, Xu, Mengwei

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

LUT-NN: Empower Efficient Neural Network Inference with Centroid Learning and Table Lookup von Tang, Xiaohu, Wang, Yang, Cao, Ting, Zhang, Li Lyna, Chen, Qi, Cai, Deng, Liu, Yunxin, Yang, Mao

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

Learning to Rank Ace Neural Architectures via Normalized Discounted Cumulative Gain von Zhang, Yuge, Zhang, Quanlu, Zhang, Li Lyna, Yang, Yaming, Yan, Chenqian, Gao, Xiaotian, Yang, Yuqing

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

Accurate and Structured Pruning for Efficient Automatic Speech Recognition von Jiang, Huiqiang, Zhang, Li Lyna, Li, Yuang, Wu, Yu, Cao, Shijie, Cao, Ting, Yang, Yuqing, Li, Jinyu, Yang, Mao, Qiu, Lili

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

Compresso: Structured Pruning with Collaborative Prompting Learns Compact Large Language Models von Guo, Song, Xu, Jiahang, Li Lyna Zhang, Mao, Yang

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers von Zhenting Qi, Ma, Mingyuan, Xu, Jiahang, Li Lyna Zhang, Yang, Fan, Mao, Yang

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone von Abdin, Marah, Awan, Ammar Ahmad, Bach, Nguyen, Bahree, Amit, Bakhtiari, Arash, Bao, Jianmin, Behl, Harkirat, Bilenko, Misha, Bjorck, Johan, Cai, Martin, Cai, Qin, Chen, Weizhu, Cheng, Hao, Chopra, Parul, Dai, Xiyang, Eldan, Ronen, Gao, Jianfeng, Gao, Min, Goswami, Abhishek, Gunasekar, Suriya, Haider, Emman, Hao, Junheng, Hewett, Russell J, Hu, Wenxiang, Huynh, Jamie, Jacobs, Sam Ade, Javaheripi, Mojan, Jin, Xin, Karampatziakis, Nikos, Kauffmann, Piero, Khademi, Mahoud, Kim, Dongwoo, Kim, Young Jin, Lee, Yin Tat, Li, Yuanzhi, Liden, Lars, Lin, Xihui, Lin, Zeqi, Liu, Liyuan, Liu, Weishung, Liu, Xiaodong, Luo, Chong, Madan, Piyush, Mahmoudzadeh, Ali, Majercak, David, Mazzola, Matt, Mendes, Caio César Teodoro, Mitra, Arindam, Modi, Hardik, Nguyen, Anh, Norick, Brandon, Patra, Barun, Perez-Becker, Daniel, Portet, Thomas, Pryzant, Reid, Qin, Heyang, Radmilac, Marko, Ren, Liliang, Rosset, Corby, Roy, Sambudha, Ruwase, Olatunji, Saarikivi, Olli, Saied, Amin, Salim, Adil, Santacroce, Michael, Shah, Shital, Shang, Ning, Sharma, Hiteshi, Shen, Yelong, Shukla, Swadheen, Song, Xia, Tanaka, Masahiro, Tupini, Andrea, Vaddamanu, Praneetha, Wang, Chunyu, Wang, Guanhua, Wang, Lijuan, Wang, Shuohang, Wang, Xin, Wang, Yu, Wen, Wen, Witte, Philipp, Wu, Haiping, Wu, Xiaoxia, Wyatt, Michael, Xiao, Bin, Xu, Can, Xu, Jiahang, Xu, Weijian, Yang, Fan, Yang, Yifan, Yang, Ziyi, Yuan, Lu, Zhang, Chenruidong, Zhang, Cyril, Zhang, Jianwen, Zhang, Yi, Zhang, Yue, Zhang, Yunan, Zhou, Xiren

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

1
2
3
4
5
6
7
8
9
10
11
Nächster
[44]

nn-METER: Towards Accurate Latency Prediction of DNN Inference on Diverse Edge Devices von Zhang, Li Lyna, Han, Shihao, Wei, Jianyu, Zheng, Ningxin, Cao, Ting, Liu, Yunxin

Constraint-aware and Ranking-distilled Token Pruning for Efficient Transformer Inference von Li, Junyan, Li Lyna Zhang, Xu, Jiahang, Wang, Yujing, Yan, Shaoguang, Xia, Yunqing, Yang, Yuqing, Cao, Ting, Sun, Hao, Deng, Weiwei, Zhang, Qi, Mao, Yang

PruneAug: Bridging DNN Pruning and Inference Latency on Diverse Sparse Platforms Using Automatic Layerwise Block Pruning von Geng, Hanfei, Liu, Yifei, Zheng, Yujie, Zhang, Li Lyna, Sun, Jingwei, Wang, Yujing, Wang, Yang, Sun, Guangzhong, Yang, Mao, Cao, Ting, Liu, Yunxin

Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers von Qi, Zhenting, Ma, Mingyuan, Xu, Jiahang, Zhang, Li Lyna, Yang, Fan, Yang, Mao

Compresso: Structured Pruning with Collaborative Prompting Learns Compact Large Language Models von Guo, Song, Xu, Jiahang, Zhang, Li Lyna, Yang, Mao

Fewer is More: Boosting LLM Reasoning with Reinforced Context Pruning von Huang, Xijie, Zhang, Li Lyna, Cheng, Kwang-Ting, Yang, Fan, Yang, Mao

SwiftPruner: Reinforced Evolutionary Pruning for Efficient Ad Relevance von Zhang, Li Lyna, Homma, Youkow, Wang, Yujing, Wu, Min, Yang, Mao, Zhang, Ruofei, Cao, Ting, Shen, Wei

Fast Hardware-Aware Neural Architecture Search von Zhang, Li Lyna, Yang, Yuqing, Jiang, Yuhang, Zhu, Wenwu, Liu, Yunxin

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking von Guan, Xinyu, Zhang, Li Lyna, Liu, Yifei, Shang, Ning, Sun, Youran, Zhu, Yi, Yang, Fan, Yang, Mao

VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models von Liu, Yifei, Wen, Jicheng, Wang, Yang, Ye, Shengyu, Zhang, Li Lyna, Cao, Ting, Li, Cheng, Yang, Mao

LongRoPE: Extending LLM Context Window Beyond 2 Million Tokens von Ding, Yiran, Zhang, Li Lyna, Zhang, Chengruidong, Xu, Yuanyuan, Shang, Ning, Xu, Jiahang, Yang, Fan, Yang, Mao

ElasticViT: Conflict-aware Supernet Training for Deploying Fast Vision Transformer on Diverse Mobile Devices von Tang, Chen, Zhang, Li Lyna, Jiang, Huiqiang, Xu, Jiahang, Cao, Ting, Zhang, Quanlu, Yang, Yuqing, Wang, Zhi, Yang, Mao

SpaceEvo: Hardware-Friendly Search Space Design for Efficient INT8 Inference von Zhang, Li Lyna, Wang, Xudong, Xu, Jiahang, Zhang, Quanlu, Wang, Yujing, Yang, Yuqing, Zheng, Ningxin, Cao, Ting, Yang, Mao

Boosting Mobile CNN Inference through Semantic Memory von Li, Yun, Zhang, Chen, Han, Shihao, Zhang, Li Lyna, Yin, Baoqun, Liu, Yunxin, Xu, Mengwei

LUT-NN: Empower Efficient Neural Network Inference with Centroid Learning and Table Lookup von Tang, Xiaohu, Wang, Yang, Cao, Ting, Zhang, Li Lyna, Chen, Qi, Cai, Deng, Liu, Yunxin, Yang, Mao

Learning to Rank Ace Neural Architectures via Normalized Discounted Cumulative Gain von Zhang, Yuge, Zhang, Quanlu, Zhang, Li Lyna, Yang, Yaming, Yan, Chenqian, Gao, Xiaotian, Yang, Yuqing

Accurate and Structured Pruning for Efficient Automatic Speech Recognition von Jiang, Huiqiang, Zhang, Li Lyna, Li, Yuang, Wu, Yu, Cao, Shijie, Cao, Ting, Yang, Yuqing, Li, Jinyu, Yang, Mao, Qiu, Lili

Compresso: Structured Pruning with Collaborative Prompting Learns Compact Large Language Models von Guo, Song, Xu, Jiahang, Li Lyna Zhang, Mao, Yang

Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers von Zhenting Qi, Ma, Mingyuan, Xu, Jiahang, Li Lyna Zhang, Yang, Fan, Mao, Yang

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle