This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Yuetao Chen, Xuliang Wang, Xinzhou Zheng, Ming Li, Peng Wang, Hong Xu

Articles by Yuetao Chen, Xuliang Wang, Xinzhou Zheng, Ming Li, Peng Wang, Hong Xu

Academic · 1 min

Make Every Draft Count: Hidden State based Speculative Decoding

arXiv:2602.21224v1 Announce Type: cross Abstract: Speculative decoding has emerged as a pivotal technique to accelerate LLM inference by employing a lightweight draft model to generate …

1 views Mar 2

Something extraordinary is coming.

Yuetao Chen, Xuliang Wang, Xinzhou Zheng, Ming Li, Peng Wang, Hong Xu

Articles by Yuetao Chen, Xuliang Wang, Xinzhou Zheng, Ming Li, Peng Wang, Hong Xu

Make Every Draft Count: Hidden State based Speculative Decoding

JCG, PC

HSOLLC Co., Ltd.