This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Xiangwen Wang, Ananth Balashankar, Varun Chandrasekaran

Articles by Xiangwen Wang, Ananth Balashankar, Varun Chandrasekaran

Academic · 1 min

Systematic Scaling Analysis of Jailbreak Attacks in Large Language Models

arXiv:2603.11149v1 Announce Type: new Abstract: Large language models remain vulnerable to jailbreak attacks, yet we still lack a systematic understanding of how jailbreak success scales …

33 views Mar 13

Xiangwen Wang, Ananth Balashankar, Varun Chandrasekaran

Articles by Xiangwen Wang, Ananth Balashankar, Varun Chandrasekaran

Systematic Scaling Analysis of Jailbreak Attacks in Large Language Models

JCG, PC

HSOLLC Co., Ltd.