This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Yinhan He, Yaochen Zhu, Mingjia Shi, Wendy Zheng, Lin Su, Xiaoqing Wang, Qi Guo, Jundong Li

Articles by Yinhan He, Yaochen Zhu, Mingjia Shi, Wendy Zheng, Lin Su, Xiaoqing Wang, Qi Guo, Jundong Li

Academic · 1 min

IAPO: Information-Aware Policy Optimization for Token-Efficient Reasoning

arXiv:2602.19049v1 Announce Type: new Abstract: Large language models increasingly rely on long chains of thought to improve accuracy, yet such gains come with substantial inference-time …

4 views Feb 25

Something extraordinary is coming.

Yinhan He, Yaochen Zhu, Mingjia Shi, Wendy Zheng, Lin Su, Xiaoqing Wang, Qi Guo, Jundong Li

Articles by Yinhan He, Yaochen Zhu, Mingjia Shi, Wendy Zheng, Lin Su, Xiaoqing Wang, Qi Guo, Jundong Li

IAPO: Information-Aware Policy Optimization for Token-Efficient Reasoning

JCG, PC

HSOLLC Co., Ltd.