Suchergebnisse - LI CONGLONG

1

OpenFold: retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization von Ahdritz, Gustaf, Bouatta, Nazim, Floristean, Christina, Kadyan, Sachin, Xia, Qinghui, Gerecke, William, O’Donnell, Timothy J., Berenberg, Daniel, Fisk, Ian, Zanichelli, Niccolò, Zhang, Bo, Nowaczynski, Arkadiusz, Wang, Bei, Stepniewska-Dziubinska, Marta M., Zhang, Shang, Ojewole, Adegoke, Guney, Murat Efe, Biderman, Stella, Watkins, Andrew M., Ra, Stephen, Lorenzo, Pablo Ribalta, Nivon, Lucas, Weitzner, Brian, Ban, Yih-En Andrew, Chen, Shiyang, Zhang, Minjia, Li, Conglong, Song, Shuaiwen Leon, He, Yuxiong, Sorger, Peter K., Mostaque, Emad, Zhang, Zhao, Bonneau, Richard, AlQuraishi, Mohammed

Veröffentlicht in Nature methods

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

Reducing DRAM row activations with eager read/write clustering von Jeon, Myeongjae, Li, Conglong, Cox, Alan L., Rixner, Scott

Veröffentlicht in ACM transactions on architecture and code optimization

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

Reducing DRAM row activations with eager read/write clustering von Jeon, Myeongjae, Li, Conglong, Cox, Alan, Rixner, Scott

Veröffentlicht in ACM transactions on architecture and code optimization

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

The Stability-Efficiency Dilemma: Investigating Sequence Length Warmup for Training GPT Models von Li, Conglong, Zhang, Minjia, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

Extreme Compression for Pre-trained Transformers Made Simple and Efficient von Wu, Xiaoxia, Yao, Zhewei, Zhang, Minjia, Li, Conglong, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

DeepSpeed Data Efficiency: Improving Deep Learning Model Quality and Training Efficiency via Efficient Data Sampling and Routing von Li, Conglong, Yao, Zhewei, Wu, Xiaoxia, Zhang, Minjia, Holmes, Connor, Li, Cheng, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

Random-LTD: Random and Layerwise Token Dropping Brings Efficient Training for Large-scale Transformers von Yao, Zhewei, Wu, Xiaoxia, Li, Conglong, Holmes, Connor, Zhang, Minjia, Li, Cheng, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

DeepSpeed-VisualChat: Multi-Round Multi-Image Interleave Chat via Multi-Modal Causal Attention von Yao, Zhewei, Wu, Xiaoxia, Li, Conglong, Zhang, Minjia, Qin, Heyang, Ruwase, Olatunji, Awan, Ammar Ahmad, Rajbhandari, Samyam, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

ZeroQuant: Efficient and Affordable Post-Training Quantization for Large-Scale Transformers von Yao, Zhewei, Aminabadi, Reza Yazdani, Zhang, Minjia, Wu, Xiaoxia, Li, Conglong, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

The Stability-Efficiency Dilemma: Investigating Sequence Length Warmup for Training GPT Models von Li, Conglong, Zhang, Minjia, He, Yuxiong

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

Maximizing Communication Efficiency for Large-scale Training via 0/1 Adam von Lu, Yucheng, Li, Conglong, Zhang, Minjia, De Sa, Christopher, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

1-bit LAMB: Communication Efficient Large-Scale Large-Batch Training with LAMB's Convergence Speed von Li, Conglong, Awan, Ammar Ahmad, Tang, Hanlin, Rajbhandari, Samyam, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale von Rajbhandari, Samyam, Li, Conglong, Yao, Zhewei, Zhang, Minjia, Aminabadi, Reza Yazdani, Awan, Ammar Ahmad, Rasley, Jeff, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

DeepSpeed-Chat: Easy, Fast and Affordable RLHF Training of ChatGPT-like Models at All Scales von Yao, Zhewei, Aminabadi, Reza Yazdani, Ruwase, Olatunji, Rajbhandari, Samyam, Wu, Xiaoxia, Awan, Ammar Ahmad, Rasley, Jeff, Zhang, Minjia, Li, Conglong, Holmes, Connor, Zhou, Zhongzhu, Wyatt, Michael, Smith, Molly, Kurilenko, Lev, Qin, Heyang, Tanaka, Masahiro, Che, Shuai, Song, Shuaiwen Leon, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

1-bit Adam: Communication Efficient Large-Scale Training with Adam's Convergence Speed von Tang, Hanlin, Gan, Shaoduo, Awan, Ammar Ahmad, Rajbhandari, Samyam, Li, Conglong, Lian, Xiangru, Liu, Ji, Zhang, Ce, He, Yuxiong

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

Extreme Compression for Pre-trained Transformers Made Simple and Efficient von Wu, Xiaoxia, Yao, Zhewei, Zhang, Minjia, Li, Conglong, He, Yuxiong

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

LLM-jp: A Cross-organizational Project for the Research and Development of Fully Open Japanese LLMs von LLM-jp, :, Aizawa, Akiko, Aramaki, Eiji, Chen, Bowen, Cheng, Fei, Deguchi, Hiroyuki, Enomoto, Rintaro, Fujii, Kazuki, Fukumoto, Kensuke, Fukushima, Takuya, Han, Namgi, Harada, Yuto, Hashimoto, Chikara, Hiraoka, Tatsuya, Hisada, Shohei, Hosokawa, Sosuke, Jie, Lu, Kamata, Keisuke, Kanazawa, Teruhito, Kanezashi, Hiroki, Kataoka, Hiroshi, Katsumata, Satoru, Kawahara, Daisuke, Kawano, Seiya, Keyaki, Atsushi, Kiryu, Keisuke, Kiyomaru, Hirokazu, Kodama, Takashi, Kubo, Takahiro, Kuga, Yohei, Kumon, Ryoma, Kurita, Shuhei, Kurohashi, Sadao, Li, Conglong, Maekawa, Taiki, Matsuda, Hiroshi, Miyao, Yusuke, Mizuki, Kentaro, Mizuki, Sakae, Murawaki, Yugo, Mousterou, Akim, Nakamura, Ryo, Nakamura, Taishi, Nakayama, Kouta, Nakazato, Tomoka, Niitsuma, Takuro, Nishitoba, Jiro, Oda, Yusuke, Ogawa, Hayato, Okamoto, Takumi, Okazaki, Naoaki, Oseki, Yohei, Ozaki, Shintaro, Ryu, Koki, Rzepka, Rafal, Sakaguchi, Keisuke, Sasaki, Shota, Sekine, Satoshi, Suda, Kohei, Sugawara, Saku, Sugiura, Issa, Sugiyama, Hiroaki, Suzuki, Hisami, Suzuki, Jun, Suzumura, Toyotaro, Tachibana, Kensuke, Takagi, Yu, Takami, Kyosuke, Takeda, Koichi, Takeshita, Masashi, Tanaka, Masahiro, Taura, Kenjiro, Tolmachev, Arseny, Ueda, Nobuhiro, Wan, Zhen, Yada, Shuntaro, Yahata, Sakiko, Yamamoto, Yuya, Yamauchi, Yusuke, Yanaka, Hitomi, Yokota, Rio, Yoshino, Koichiro

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

DeepSpeed Data Efficiency: Improving Deep Learning Model Quality and Training Efficiency via Efficient Data Sampling and Routing von Li, Conglong, Yao, Zhewei, Wu, Xiaoxia, Zhang, Minjia, Holmes, Connor, Cheng, Li, He, Yuxiong

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

Random-LTD: Random and Layerwise Token Dropping Brings Efficient Training for Large-scale Transformers von Yao, Zhewei, Wu, Xiaoxia, Li, Conglong, Holmes, Connor, Zhang, Minjia, Cheng, Li, He, Yuxiong

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

DeepSpeed-VisualChat: Multi-Round Multi-Image Interleave Chat via Multi-Modal Causal Attention von Yao, Zhewei, Wu, Xiaoxia, Li, Conglong, Zhang, Minjia, Qin, Heyang, Olatunji Ruwase, Ammar Ahmad Awan, Rajbhandari, Samyam, He, Yuxiong

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

1
2
3
4
5
6
7
8
9
10
11
Nächster
[21]

Reducing DRAM row activations with eager read/write clustering von Jeon, Myeongjae, Li, Conglong, Cox, Alan L., Rixner, Scott

Reducing DRAM row activations with eager read/write clustering von Jeon, Myeongjae, Li, Conglong, Cox, Alan, Rixner, Scott

The Stability-Efficiency Dilemma: Investigating Sequence Length Warmup for Training GPT Models von Li, Conglong, Zhang, Minjia, He, Yuxiong

Extreme Compression for Pre-trained Transformers Made Simple and Efficient von Wu, Xiaoxia, Yao, Zhewei, Zhang, Minjia, Li, Conglong, He, Yuxiong

DeepSpeed Data Efficiency: Improving Deep Learning Model Quality and Training Efficiency via Efficient Data Sampling and Routing von Li, Conglong, Yao, Zhewei, Wu, Xiaoxia, Zhang, Minjia, Holmes, Connor, Li, Cheng, He, Yuxiong

Random-LTD: Random and Layerwise Token Dropping Brings Efficient Training for Large-scale Transformers von Yao, Zhewei, Wu, Xiaoxia, Li, Conglong, Holmes, Connor, Zhang, Minjia, Li, Cheng, He, Yuxiong

DeepSpeed-VisualChat: Multi-Round Multi-Image Interleave Chat via Multi-Modal Causal Attention von Yao, Zhewei, Wu, Xiaoxia, Li, Conglong, Zhang, Minjia, Qin, Heyang, Ruwase, Olatunji, Awan, Ammar Ahmad, Rajbhandari, Samyam, He, Yuxiong

ZeroQuant: Efficient and Affordable Post-Training Quantization for Large-Scale Transformers von Yao, Zhewei, Aminabadi, Reza Yazdani, Zhang, Minjia, Wu, Xiaoxia, Li, Conglong, He, Yuxiong

The Stability-Efficiency Dilemma: Investigating Sequence Length Warmup for Training GPT Models von Li, Conglong, Zhang, Minjia, He, Yuxiong

Maximizing Communication Efficiency for Large-scale Training via 0/1 Adam von Lu, Yucheng, Li, Conglong, Zhang, Minjia, De Sa, Christopher, He, Yuxiong

1-bit LAMB: Communication Efficient Large-Scale Large-Batch Training with LAMB's Convergence Speed von Li, Conglong, Awan, Ammar Ahmad, Tang, Hanlin, Rajbhandari, Samyam, He, Yuxiong

DeepSpeed-MoE: Advancing Mixture-of-Experts Inference and Training to Power Next-Generation AI Scale von Rajbhandari, Samyam, Li, Conglong, Yao, Zhewei, Zhang, Minjia, Aminabadi, Reza Yazdani, Awan, Ammar Ahmad, Rasley, Jeff, He, Yuxiong

1-bit Adam: Communication Efficient Large-Scale Training with Adam's Convergence Speed von Tang, Hanlin, Gan, Shaoduo, Awan, Ammar Ahmad, Rajbhandari, Samyam, Li, Conglong, Lian, Xiangru, Liu, Ji, Zhang, Ce, He, Yuxiong

Extreme Compression for Pre-trained Transformers Made Simple and Efficient von Wu, Xiaoxia, Yao, Zhewei, Zhang, Minjia, Li, Conglong, He, Yuxiong

DeepSpeed Data Efficiency: Improving Deep Learning Model Quality and Training Efficiency via Efficient Data Sampling and Routing von Li, Conglong, Yao, Zhewei, Wu, Xiaoxia, Zhang, Minjia, Holmes, Connor, Cheng, Li, He, Yuxiong

Random-LTD: Random and Layerwise Token Dropping Brings Efficient Training for Large-scale Transformers von Yao, Zhewei, Wu, Xiaoxia, Li, Conglong, Holmes, Connor, Zhang, Minjia, Cheng, Li, He, Yuxiong

DeepSpeed-VisualChat: Multi-Round Multi-Image Interleave Chat via Multi-Modal Causal Attention von Yao, Zhewei, Wu, Xiaoxia, Li, Conglong, Zhang, Minjia, Qin, Heyang, Olatunji Ruwase, Ammar Ahmad Awan, Rajbhandari, Samyam, He, Yuxiong

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle