Suchergebnisse - Morwani, Depen

1

Deconstructing What Makes a Good Optimizer for Language Models von Zhao, Rosie, Morwani, Depen, Brandfonbrener, David, Vyas, Nikhil, Kakade, Sham

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

Inductive Bias of Gradient Descent for Weight Normalized Smooth Homogeneous Neural Nets von Morwani, Depen, Ramaswamy, Harish G

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

How Does Critical Batch Size Scale in Pre-training? von Zhang, Hanlin, Morwani, Depen, Vyas, Nikhil, Wu, Jingfeng, Zou, Difan, Ghai, Udaya, Foster, Dean, Kakade, Sham

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

Simplicity Bias in 1-Hidden Layer Neural Networks von Morwani, Depen, Batra, Jatin, Jain, Prateek, Netrapalli, Praneeth

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

SOAP: Improving and Stabilizing Shampoo using Adam von Vyas, Nikhil, Morwani, Depen, Zhao, Rosie, Shapira, Itai, Brandfonbrener, David, Janson, Lucas, Kakade, Sham

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

A New Perspective on Shampoo's Preconditioner von Morwani, Depen, Shapira, Itai, Vyas, Nikhil, Malach, Eran, Kakade, Sham, Janson, Lucas

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

Using noise resilience for ranking generalization of deep neural networks von Morwani, Depen, Vashisht, Rahul, Ramaswamy, Harish G

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

Inductive Bias of Gradient Descent for Weight Normalized Smooth Homogeneous Neural Nets von Morwani, Depen, Ramaswamy, Harish G

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

Feature emergence via margin maximization: case studies in algebraic tasks von Morwani, Depen, Edelman, Benjamin L, Oncescu, Costin-Andrei, Zhao, Rosie, Kakade, Sham

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

Beyond Implicit Bias: The Insignificance of SGD Noise in Online Learning von Vyas, Nikhil, Morwani, Depen, Zhao, Rosie, Kaplun, Gal, Kakade, Sham, Barak, Boaz

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

Feature-Learning Networks Are Consistent Across Widths At Realistic Scales von Vyas, Nikhil, Atanasov, Alexander, Bordelon, Blake, Morwani, Depen, Sainathan, Sabarish, Pehlevan, Cengiz

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

Deconstructing What Makes a Good Optimizer for Language Models von Zhao, Rosie, Morwani, Depen, Brandfonbrener, David, Vyas, Nikhil, Kakade, Sham

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

How Does Critical Batch Size Scale in Pre-training? von Zhang, Hanlin, Morwani, Depen, Vyas, Nikhil, Wu, Jingfeng, Zou, Difan, Ghai, Udaya, Foster, Dean, Kakade, Sham

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

Simplicity Bias in 1-Hidden Layer Neural Networks von Morwani, Depen, Batra, Jatin, Jain, Prateek, Praneeth Netrapalli

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

SOAP: Improving and Stabilizing Shampoo using Adam von Vyas, Nikhil, Morwani, Depen, Zhao, Rosie, Shapira, Itai, Brandfonbrener, David, Janson, Lucas, Kakade, Sham

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

A New Perspective on Shampoo's Preconditioner von Morwani, Depen, Shapira, Itai, Vyas, Nikhil, Malach, Eran, Kakade, Sham, Janson, Lucas

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

Beyond Implicit Bias: The Insignificance of SGD Noise in Online Learning von Vyas, Nikhil, Morwani, Depen, Zhao, Rosie, Kaplun, Gal, Kakade, Sham, Barak, Boaz

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

Using noise resilience for ranking generalization of deep neural networks von Morwani, Depen, Vashisht, Rahul, Ramaswamy, Harish G

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

Feature emergence via margin maximization: case studies in algebraic tasks von Morwani, Depen, Edelman, Benjamin L, Costin-Andrei Oncescu, Zhao, Rosie, Kakade, Sham

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

Feature-Learning Networks Are Consistent Across Widths At Realistic Scales von Vyas, Nikhil, Atanasov, Alexander, Bordelon, Blake, Morwani, Depen, Sainathan, Sabarish, Pehlevan, Cengiz

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

Deconstructing What Makes a Good Optimizer for Language Models von Zhao, Rosie, Morwani, Depen, Brandfonbrener, David, Vyas, Nikhil, Kakade, Sham

Inductive Bias of Gradient Descent for Weight Normalized Smooth Homogeneous Neural Nets von Morwani, Depen, Ramaswamy, Harish G

How Does Critical Batch Size Scale in Pre-training? von Zhang, Hanlin, Morwani, Depen, Vyas, Nikhil, Wu, Jingfeng, Zou, Difan, Ghai, Udaya, Foster, Dean, Kakade, Sham

Simplicity Bias in 1-Hidden Layer Neural Networks von Morwani, Depen, Batra, Jatin, Jain, Prateek, Netrapalli, Praneeth

SOAP: Improving and Stabilizing Shampoo using Adam von Vyas, Nikhil, Morwani, Depen, Zhao, Rosie, Shapira, Itai, Brandfonbrener, David, Janson, Lucas, Kakade, Sham

A New Perspective on Shampoo's Preconditioner von Morwani, Depen, Shapira, Itai, Vyas, Nikhil, Malach, Eran, Kakade, Sham, Janson, Lucas

Using noise resilience for ranking generalization of deep neural networks von Morwani, Depen, Vashisht, Rahul, Ramaswamy, Harish G

Inductive Bias of Gradient Descent for Weight Normalized Smooth Homogeneous Neural Nets von Morwani, Depen, Ramaswamy, Harish G

Feature emergence via margin maximization: case studies in algebraic tasks von Morwani, Depen, Edelman, Benjamin L, Oncescu, Costin-Andrei, Zhao, Rosie, Kakade, Sham

Beyond Implicit Bias: The Insignificance of SGD Noise in Online Learning von Vyas, Nikhil, Morwani, Depen, Zhao, Rosie, Kaplun, Gal, Kakade, Sham, Barak, Boaz

Feature-Learning Networks Are Consistent Across Widths At Realistic Scales von Vyas, Nikhil, Atanasov, Alexander, Bordelon, Blake, Morwani, Depen, Sainathan, Sabarish, Pehlevan, Cengiz

Deconstructing What Makes a Good Optimizer for Language Models von Zhao, Rosie, Morwani, Depen, Brandfonbrener, David, Vyas, Nikhil, Kakade, Sham

How Does Critical Batch Size Scale in Pre-training? von Zhang, Hanlin, Morwani, Depen, Vyas, Nikhil, Wu, Jingfeng, Zou, Difan, Ghai, Udaya, Foster, Dean, Kakade, Sham

Simplicity Bias in 1-Hidden Layer Neural Networks von Morwani, Depen, Batra, Jatin, Jain, Prateek, Praneeth Netrapalli

SOAP: Improving and Stabilizing Shampoo using Adam von Vyas, Nikhil, Morwani, Depen, Zhao, Rosie, Shapira, Itai, Brandfonbrener, David, Janson, Lucas, Kakade, Sham

A New Perspective on Shampoo's Preconditioner von Morwani, Depen, Shapira, Itai, Vyas, Nikhil, Malach, Eran, Kakade, Sham, Janson, Lucas

Beyond Implicit Bias: The Insignificance of SGD Noise in Online Learning von Vyas, Nikhil, Morwani, Depen, Zhao, Rosie, Kaplun, Gal, Kakade, Sham, Barak, Boaz

Using noise resilience for ranking generalization of deep neural networks von Morwani, Depen, Vashisht, Rahul, Ramaswamy, Harish G

Feature emergence via margin maximization: case studies in algebraic tasks von Morwani, Depen, Edelman, Benjamin L, Costin-Andrei Oncescu, Zhao, Rosie, Kakade, Sham

Feature-Learning Networks Are Consistent Across Widths At Realistic Scales von Vyas, Nikhil, Atanasov, Alexander, Bordelon, Blake, Morwani, Depen, Sainathan, Sabarish, Pehlevan, Cengiz

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle