This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Amirabbas Afzali, Myeongho Jeon, Maria Brbic

Articles by Amirabbas Afzali, Myeongho Jeon, Maria Brbic

Academic · 1 min

When Weak LLMs Speak with Confidence, Preference Alignment Gets Stronger

arXiv:2603.04968v1 Announce Type: new Abstract: Preference alignment is an essential step in adapting large language models (LLMs) to human values, but existing approaches typically depend …

3 views Mar 7

Amirabbas Afzali, Myeongho Jeon, Maria Brbic

Articles by Amirabbas Afzali, Myeongho Jeon, Maria Brbic

When Weak LLMs Speak with Confidence, Preference Alignment Gets Stronger

JCG, PC

HSOLLC Co., Ltd.