This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Aman Sharma, Paras Chopra

Articles by Aman Sharma, Paras Chopra

Academic · 1 min

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

arXiv:2603.09678v1 Announce Type: new Abstract: Large language models achieve near-ceiling performance on code generation benchmarks, yet these results increasingly reflect memorization rather than genuine reasoning. …

15 views Mar 11

Aman Sharma, Paras Chopra

Articles by Aman Sharma, Paras Chopra

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

JCG, PC

HSOLLC Co., Ltd.