This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Yixuan Wang, Qingyu Shi, Jiayu Zhou, Dianbo Liu, Ziwei He, Zhouhan Lin

Articles by Yixuan Wang, Qingyu Shi, Jiayu Zhou, Dianbo Liu, Ziwei He, Zhouhan Lin

Academic · 1 min

VQKV: High-Fidelity and High-Ratio Cache Compression via Vector-Quantization

arXiv:2603.16435v1 Announce Type: new Abstract: The growing context length of Large Language Models (LLMs) enlarges the Key-Value (KV) cache, limiting deployment in resource-limited environments. Prior …

11 views Mar 18

Yixuan Wang, Qingyu Shi, Jiayu Zhou, Dianbo Liu, Ziwei He, Zhouhan Lin

Articles by Yixuan Wang, Qingyu Shi, Jiayu Zhou, Dianbo Liu, Ziwei He, Zhouhan Lin

VQKV: High-Fidelity and High-Ratio Cache Compression via Vector-Quantization

JCG, PC

HSOLLC Co., Ltd.