This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Taejong Joo, Wenhan Xia, Cheolmin Kim, Ming Zhang, Eugene Ie

Articles by Taejong Joo, Wenhan Xia, Cheolmin Kim, Ming Zhang, Eugene Ie

Academic · 1 min

On Surprising Effectiveness of Masking Updates in Adaptive Optimizers

arXiv:2602.15322v1 Announce Type: new Abstract: Training large language models (LLMs) relies almost exclusively on dense adaptive optimizers with increasingly sophisticated preconditioners. We challenge this by …

4 views Feb 19

Something extraordinary is coming.

Taejong Joo, Wenhan Xia, Cheolmin Kim, Ming Zhang, Eugene Ie

Articles by Taejong Joo, Wenhan Xia, Cheolmin Kim, Ming Zhang, Eugene Ie

On Surprising Effectiveness of Masking Updates in Adaptive Optimizers

JCG, PC

HSOLLC Co., Ltd.