XGrad: Boosting Gradient-Based Optimizers With Weight Prediction

In this paper, we propose a general deep learning training framework XGrad which introduces weight prediction into the popular gradient-based optimizers to boost their convergence and generalization when training the deep neural network (DNN) models. In particular, ahead of each mini-batch training,...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	IEEE transactions on pattern analysis and machine intelligence 2024-10, Vol.46 (10), p.6731-6747
Hauptverfasser:	Guan, Lei, Li, Dongsheng, Shi, Yanqi, Meng, Jian
Format:	Artikel
Sprache:	eng
Schlagworte:	Artificial neural networks Backpropagation Computational modeling Convergence deep learning generalization gradient-based optimizer Predictive models Proposals Training weight prediction
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Schreiben Sie den ersten Kommentar!