This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Hanglin Li, Shuchang Tian, Chen Lin, Zhiyong Zhao, Kun Zhan

Articles by Hanglin Li, Shuchang Tian, Chen Lin, Zhiyong Zhao, Kun Zhan

Academic · 1 min

FAAR: Format-Aware Adaptive Rounding for NVFP4

arXiv:2603.22370v1 Announce Type: new Abstract: Deploying large language models (LLMs) on edge devices requires extremely low-bit quantization. Ultra-low precision formats such as NVFP4 offer a …

4 views Mar 25

Hanglin Li, Shuchang Tian, Chen Lin, Zhiyong Zhao, Kun Zhan

Articles by Hanglin Li, Shuchang Tian, Chen Lin, Zhiyong Zhao, Kun Zhan

FAAR: Format-Aware Adaptive Rounding for NVFP4

JCG, PC

HSOLLC Co., Ltd.