Suchergebnisse - DU CUNXIAO

1

SWIFT: On-the-Fly Self-Speculative Decoding for LLM Inference Acceleration von Xia, Heming, Li, Yongqi, Zhang, Jun, Du, Cunxiao, Li, Wenjie

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

Revisiting the Markov Property for Machine Translation von Du, Cunxiao, Zhou, Hao, Tu, Zhaopeng, Jiang, Jing

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training von Wang, Haonan, Liu, Qian, Du, Chao, Zhu, Tongyao, Du, Cunxiao, Kawaguchi, Kenji, Pang, Tianyu

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction von Zhang, Xuan, Du, Cunxiao, Du, Chao, Pang, Tianyu, Gao, Wei, Lin, Min

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

When Attention Sink Emerges in Language Models: An Empirical View von Gu, Xiangming, Pang, Tianyu, Du, Chao, Liu, Qian, Zhang, Fengzhuo, Du, Cunxiao, Wang, Ye, Lin, Min

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

Order-Agnostic Cross Entropy for Non-Autoregressive Machine Translation von Du, Cunxiao, Tu, Zhaopeng, Jiang, Jing

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

Reverse Modeling in Large Language Models von Yu, Sicheng, Xu, Yuanchen, Du, Cunxiao, Zhou, Yanying, Qiu, Minghui, Sun, Qianru, Zhang, Hao, Wu, Jiawei

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

ngram-OAXE: Phrase-Based Order-Agnostic Cross Entropy for Non-Autoregressive Machine Translation von Du, Cunxiao, Tu, Zhaopeng, Wang, Longyue, Jiang, Jing

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

Efficient Inference for Large Language Model-based Generative Recommendation von Lin, Xinyu, Yang, Chaoqun, Wang, Wenjie, Li, Yongqi, Du, Cunxiao, Feng, Fuli, Ng, See-Kiong, Chua, Tat-Seng

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

SWIFT: On-the-Fly Self-Speculative Decoding for LLM Inference Acceleration von Xia, Heming, Li, Yongqi, Zhang, Jun, Du, Cunxiao, Li, Wenjie

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

GliDe with a CaPE: A Low-Hassle Method to Accelerate Speculative Decoding von Du, Cunxiao, Jiang, Jing, Yuanchen, Xu, Wu, Jiawei, Yu, Sicheng, Li, Yongqi, Li, Shenggui, Xu, Kai, Nie, Liqiang, Tu, Zhaopeng, You, Yang

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

Revisiting the Markov Property for Machine Translation von Du, Cunxiao, Zhou, Hao, Tu, Zhaopeng, Jiang, Jing

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training von Wang, Haonan, Liu, Qian, Du, Chao, Zhu, Tongyao, Du, Cunxiao, Kawaguchi, Kenji, Pang, Tianyu

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction von Zhang, Xuan, Du, Cunxiao, Du, Chao, Pang, Tianyu, Gao, Wei, Lin, Min

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

When Attention Sink Emerges in Language Models: An Empirical View von Gu, Xiangming, Pang, Tianyu, Du, Chao, Liu, Qian, Zhang, Fengzhuo, Du, Cunxiao, Wang, Ye, Lin, Min

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

Order-Agnostic Cross Entropy for Non-Autoregressive Machine Translation von Du, Cunxiao, Tu, Zhaopeng, Jiang, Jing

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

Reverse Modeling in Large Language Models von Yu, Sicheng, Xu, Yuanchen, Du, Cunxiao, Zhou, Yanying, Qiu, Minghui, Sun, Qianru, Zhang, Hao, Wu, Jiawei

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

ngram-OAXE: Phrase-Based Order-Agnostic Cross Entropy for Non-Autoregressive Machine Translation von Du, Cunxiao, Tu, Zhaopeng, Wang, Longyue, Jiang, Jing

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

Efficient Inference for Large Language Model-based Generative Recommendation von Lin, Xinyu, Yang, Chaoqun, Wang, Wenjie, Li, Yongqi, Du, Cunxiao, Feng, Fuli, See-Kiong Ng, Tat-Seng Chua

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

Explicit Interaction Model towards Text Classification von Du, Cunxiao, Chin, Zhaozheng, Feng, Fuli, Zhu, Lei, Gan, Tian, Nie, Liqiang

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

SWIFT: On-the-Fly Self-Speculative Decoding for LLM Inference Acceleration von Xia, Heming, Li, Yongqi, Zhang, Jun, Du, Cunxiao, Li, Wenjie

Revisiting the Markov Property for Machine Translation von Du, Cunxiao, Zhou, Hao, Tu, Zhaopeng, Jiang, Jing

When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training von Wang, Haonan, Liu, Qian, Du, Chao, Zhu, Tongyao, Du, Cunxiao, Kawaguchi, Kenji, Pang, Tianyu

SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction von Zhang, Xuan, Du, Cunxiao, Du, Chao, Pang, Tianyu, Gao, Wei, Lin, Min

When Attention Sink Emerges in Language Models: An Empirical View von Gu, Xiangming, Pang, Tianyu, Du, Chao, Liu, Qian, Zhang, Fengzhuo, Du, Cunxiao, Wang, Ye, Lin, Min

Order-Agnostic Cross Entropy for Non-Autoregressive Machine Translation von Du, Cunxiao, Tu, Zhaopeng, Jiang, Jing

Reverse Modeling in Large Language Models von Yu, Sicheng, Xu, Yuanchen, Du, Cunxiao, Zhou, Yanying, Qiu, Minghui, Sun, Qianru, Zhang, Hao, Wu, Jiawei

ngram-OAXE: Phrase-Based Order-Agnostic Cross Entropy for Non-Autoregressive Machine Translation von Du, Cunxiao, Tu, Zhaopeng, Wang, Longyue, Jiang, Jing

Efficient Inference for Large Language Model-based Generative Recommendation von Lin, Xinyu, Yang, Chaoqun, Wang, Wenjie, Li, Yongqi, Du, Cunxiao, Feng, Fuli, Ng, See-Kiong, Chua, Tat-Seng

SWIFT: On-the-Fly Self-Speculative Decoding for LLM Inference Acceleration von Xia, Heming, Li, Yongqi, Zhang, Jun, Du, Cunxiao, Li, Wenjie

GliDe with a CaPE: A Low-Hassle Method to Accelerate Speculative Decoding von Du, Cunxiao, Jiang, Jing, Yuanchen, Xu, Wu, Jiawei, Yu, Sicheng, Li, Yongqi, Li, Shenggui, Xu, Kai, Nie, Liqiang, Tu, Zhaopeng, You, Yang

Revisiting the Markov Property for Machine Translation von Du, Cunxiao, Zhou, Hao, Tu, Zhaopeng, Jiang, Jing

When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training von Wang, Haonan, Liu, Qian, Du, Chao, Zhu, Tongyao, Du, Cunxiao, Kawaguchi, Kenji, Pang, Tianyu

SimLayerKV: A Simple Framework for Layer-Level KV Cache Reduction von Zhang, Xuan, Du, Cunxiao, Du, Chao, Pang, Tianyu, Gao, Wei, Lin, Min

When Attention Sink Emerges in Language Models: An Empirical View von Gu, Xiangming, Pang, Tianyu, Du, Chao, Liu, Qian, Zhang, Fengzhuo, Du, Cunxiao, Wang, Ye, Lin, Min

Order-Agnostic Cross Entropy for Non-Autoregressive Machine Translation von Du, Cunxiao, Tu, Zhaopeng, Jiang, Jing

Reverse Modeling in Large Language Models von Yu, Sicheng, Xu, Yuanchen, Du, Cunxiao, Zhou, Yanying, Qiu, Minghui, Sun, Qianru, Zhang, Hao, Wu, Jiawei

ngram-OAXE: Phrase-Based Order-Agnostic Cross Entropy for Non-Autoregressive Machine Translation von Du, Cunxiao, Tu, Zhaopeng, Wang, Longyue, Jiang, Jing

Efficient Inference for Large Language Model-based Generative Recommendation von Lin, Xinyu, Yang, Chaoqun, Wang, Wenjie, Li, Yongqi, Du, Cunxiao, Feng, Fuli, See-Kiong Ng, Tat-Seng Chua

Explicit Interaction Model towards Text Classification von Du, Cunxiao, Chin, Zhaozheng, Feng, Fuli, Zhu, Lei, Gan, Tian, Nie, Liqiang

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle