This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Jiangweizhi Peng, Yuanxin Liu, Ruida Zhou, Charles Fleming, Zhaoran Wang, Alfredo Garcia, Mingyi Hong

Articles by Jiangweizhi Peng, Yuanxin Liu, Ruida Zhou, Charles Fleming, Zhaoran Wang, Alfredo Garcia, Mingyi Hong

Academic · 1 min

HiPER: Hierarchical Reinforcement Learning with Explicit Credit Assignment for Large Language Model Agents

arXiv:2602.16165v1 Announce Type: new Abstract: Training LLMs as interactive agents for multi-turn decision-making remains challenging, particularly in long-horizon tasks with sparse and delayed rewards, where …

5 views Feb 20

Something extraordinary is coming.

Jiangweizhi Peng, Yuanxin Liu, Ruida Zhou, Charles Fleming, Zhaoran Wang, Alfredo Garcia, Mingyi Hong

Articles by Jiangweizhi Peng, Yuanxin Liu, Ruida Zhou, Charles Fleming, Zhaoran Wang, Alfredo Garcia, Mingyi Hong

HiPER: Hierarchical Reinforcement Learning with Explicit Credit Assignment for Large Language Model Agents

JCG, PC

HSOLLC Co., Ltd.