This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan

Articles by Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan

Academic · 1 min

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

arXiv:2602.15112v1 Announce Type: new Abstract: We introduce ResearchGym, a benchmark and execution environment for evaluating AI agents on end-to-end research. To instantiate this, we repurpose …

17 views Mar 7

Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan

Articles by Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

JCG, PC

HSOLLC Co., Ltd.