This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Seongjin Cha, Gyuwan Kim, Dongsu Han, Tao Yang, Insu Han

Articles by Seongjin Cha, Gyuwan Kim, Dongsu Han, Tao Yang, Insu Han

Academic · 1 min

KnapSpec: Self-Speculative Decoding via Adaptive Layer Selection as a Knapsack Problem

arXiv:2602.20217v1 Announce Type: new Abstract: Self-speculative decoding (SSD) accelerates LLM inference by skipping layers to create an efficient draft model, yet existing methods often rely …

4 views Feb 26

Something extraordinary is coming.

Seongjin Cha, Gyuwan Kim, Dongsu Han, Tao Yang, Insu Han

Articles by Seongjin Cha, Gyuwan Kim, Dongsu Han, Tao Yang, Insu Han

KnapSpec: Self-Speculative Decoding via Adaptive Layer Selection as a Knapsack Problem

JCG, PC

HSOLLC Co., Ltd.