This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Zhiqin Qian, Ryan Diaz, Sangwon Seo, Vaibhav Unhelkar

Articles by Zhiqin Qian, Ryan Diaz, Sangwon Seo, Vaibhav Unhelkar

Academic · 1 min

Hierarchical Reward Design from Language: Enhancing Alignment of Agent Behavior with Human Specifications

arXiv:2602.18582v1 Announce Type: new Abstract: When training artificial intelligence (AI) to perform tasks, humans often care not only about whether a task is completed but …

3 views Mar 7

Zhiqin Qian, Ryan Diaz, Sangwon Seo, Vaibhav Unhelkar

Articles by Zhiqin Qian, Ryan Diaz, Sangwon Seo, Vaibhav Unhelkar

Hierarchical Reward Design from Language: Enhancing Alignment of Agent Behavior with Human Specifications

JCG, PC

HSOLLC Co., Ltd.