-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
Inductive Bias of Gradient Descent for Weight Normalized Smooth Homogeneous Neural Nets
Veröffentlicht in arXiv.org
VolltextArtikel -
9
-
10
-
11
-
12
Deconstructing What Makes a Good Optimizer for Language Models
Veröffentlicht in arXiv.org
VolltextArtikel -
13
-
14
-
15
-
16
-
17
Beyond Implicit Bias: The Insignificance of SGD Noise in Online Learning
Veröffentlicht in arXiv.org
VolltextArtikel -
18
Using noise resilience for ranking generalization of deep neural networks
Veröffentlicht in arXiv.org
VolltextArtikel -
19
Feature emergence via margin maximization: case studies in algebraic tasks
Veröffentlicht in arXiv.org
VolltextArtikel -
20
Feature-Learning Networks Are Consistent Across Widths At Realistic Scales
Veröffentlicht in arXiv.org
VolltextArtikel