This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Xingyao Wang, Valerie Chen, Heng Ji, Graham Neubig

Articles by Xingyao Wang, Valerie Chen, Heng Ji, Graham Neubig

Academic · 1 min

A Rubric-Supervised Critic from Sparse Real-World Outcomes

arXiv:2603.03800v1 Announce Type: new Abstract: Academic benchmarks for coding agents tend to reward autonomous task completion, measured by verifiable rewards such as unit-test success. In …

31 views Mar 7

Xingyao Wang, Valerie Chen, Heng Ji, Graham Neubig

Articles by Xingyao Wang, Valerie Chen, Heng Ji, Graham Neubig

A Rubric-Supervised Critic from Sparse Real-World Outcomes

JCG, PC

HSOLLC Co., Ltd.