This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Yuxiao Lu, Lin Xu, Yang Sun, Wenjun Li, Jie Shi

Articles by Yuxiao Lu, Lin Xu, Yang Sun, Wenjun Li, Jie Shi

Academic · 1 min

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

arXiv:2603.03323v1 Announce Type: cross Abstract: Large language models (LLMs) aligned for safety often suffer from over-refusal, the tendency to reject seemingly toxic or benign prompts …

19 views Mar 6

Yuxiao Lu, Lin Xu, Yang Sun, Wenjun Li, Jie Shi

Articles by Yuxiao Lu, Lin Xu, Yang Sun, Wenjun Li, Jie Shi

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

JCG, PC

HSOLLC Co., Ltd.