This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Roy Miles, Aysim Toker, Andreea-Maria Oncescu, Songcen Xu, Jiankang Deng, Ismail Elezi

Articles by Roy Miles, Aysim Toker, Andreea-Maria Oncescu, Songcen Xu, Jiankang Deng, Ismail Elezi

Academic · 1 min

Test-Time Scaling with Diffusion Language Models via Reward-Guided Stitching

arXiv:2602.22871v1 Announce Type: new Abstract: Reasoning with large language models often benefits from generating multiple chains-of-thought, but existing aggregation strategies are typically trajectory-level (e.g., selecting …

6 views Feb 28

Something extraordinary is coming.

Roy Miles, Aysim Toker, Andreea-Maria Oncescu, Songcen Xu, Jiankang Deng, Ismail Elezi

Articles by Roy Miles, Aysim Toker, Andreea-Maria Oncescu, Songcen Xu, Jiankang Deng, Ismail Elezi

Test-Time Scaling with Diffusion Language Models via Reward-Guided Stitching

JCG, PC

HSOLLC Co., Ltd.