This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Guillaume Corlouer, Avi Semler, Alexander Strang, Alexander Gietelink Oldenziel

Articles by Guillaume Corlouer, Avi Semler, Alexander Strang, Alexander Gietelink Oldenziel

Academic · 1 min

Stochastic Gradient Descent in the Saddle-to-Saddle Regime of Deep Linear Networks

arXiv:2604.06366v1 Announce Type: new Abstract: Deep linear networks (DLNs) are used as an analytically tractable model of the training dynamics of deep neural networks. While …

67 views Apr 9

Guillaume Corlouer, Avi Semler, Alexander Strang, Alexander Gietelink Oldenziel

Articles by Guillaume Corlouer, Avi Semler, Alexander Strang, Alexander Gietelink Oldenziel

Stochastic Gradient Descent in the Saddle-to-Saddle Regime of Deep Linear Networks

JCG, PC

HSOLLC Co., Ltd.