This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Edward Chen, Sanmi Koyejo, Carlos Guestrin

Articles by Edward Chen, Sanmi Koyejo, Carlos Guestrin

Academic · 1 min

Discovering Implicit Large Language Model Alignment Objectives

arXiv:2602.15338v1 Announce Type: cross Abstract: Large language model (LLM) alignment relies on complex reward signals that often obscure the specific behaviors being incentivized, creating critical …

7 views Feb 19

Something extraordinary is coming.

Edward Chen, Sanmi Koyejo, Carlos Guestrin

Articles by Edward Chen, Sanmi Koyejo, Carlos Guestrin

Discovering Implicit Large Language Model Alignment Objectives

JCG, PC

HSOLLC Co., Ltd.