This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Mateusz Nowak, Xavier Cadet, Peter Chin

Articles by Mateusz Nowak, Xavier Cadet, Peter Chin

Academic · 1 min

ABCD: All Biases Come Disguised

arXiv:2602.17445v1 Announce Type: new Abstract: Multiple-choice question (MCQ) benchmarks have been a standard evaluation practice for measuring LLMs' ability to reason and answer knowledge-based questions. …

15 views Feb 21

Something extraordinary is coming.

Mateusz Nowak, Xavier Cadet, Peter Chin

Articles by Mateusz Nowak, Xavier Cadet, Peter Chin

ABCD: All Biases Come Disguised

JCG, PC

HSOLLC Co., Ltd.