This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Mengxuan Hu, Vivek V. Datla, Anoop Kumar, Zihan Guan, Sheng Li, Alfy Samuel, Daben Liu

Articles by Mengxuan Hu, Vivek V. Datla, Anoop Kumar, Zihan Guan, Sheng Li, Alfy Samuel, Daben Liu

Academic · 1 min

Alignment-Weighted DPO: A principled reasoning approach to improve safety alignment

arXiv:2602.21346v1 Announce Type: cross Abstract: Recent advances in alignment techniques such as Supervised Fine-Tuning (SFT), Reinforcement Learning from Human Feedback (RLHF), and Direct Preference Optimization …

6 views Mar 1

Something extraordinary is coming.

Mengxuan Hu, Vivek V. Datla, Anoop Kumar, Zihan Guan, Sheng Li, Alfy Samuel, Daben Liu

Articles by Mengxuan Hu, Vivek V. Datla, Anoop Kumar, Zihan Guan, Sheng Li, Alfy Samuel, Daben Liu

Alignment-Weighted DPO: A principled reasoning approach to improve safety alignment

JCG, PC

HSOLLC Co., Ltd.