This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Zirui Zhu, Hailun Xu, Yang Luo, Yong Liu, Kanchan Sarkar, Kun Xu, Yang You

Articles by Zirui Zhu, Hailun Xu, Yang Luo, Yong Liu, Kanchan Sarkar, Kun Xu, Yang You

Academic · 1 min

CAMEL: Confidence-Gated Reflection for Reward Modeling

arXiv:2602.20670v1 Announce Type: new Abstract: Reward models play a fundamental role in aligning large language models with human preferences. Existing methods predominantly follow two paradigms: …

9 views Feb 26

Something extraordinary is coming.

Zirui Zhu, Hailun Xu, Yang Luo, Yong Liu, Kanchan Sarkar, Kun Xu, Yang You

Articles by Zirui Zhu, Hailun Xu, Yang Luo, Yong Liu, Kanchan Sarkar, Kun Xu, Yang You

CAMEL: Confidence-Gated Reflection for Reward Modeling

JCG, PC

HSOLLC Co., Ltd.