This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Tarjei Paule Hage, Markus J. Buehler

Articles by Tarjei Paule Hage, Markus J. Buehler

Academic · 1 min

BeamPERL: Parameter-Efficient RL with Verifiable Rewards Specializes Compact LLMs for Structured Beam Mechanics Reasoning

arXiv:2603.04124v1 Announce Type: new Abstract: Can reinforcement learning with hard, verifiable rewards teach a compact language model to reason about physics, or does it primarily …

18 views Mar 7

Tarjei Paule Hage, Markus J. Buehler

Articles by Tarjei Paule Hage, Markus J. Buehler

BeamPERL: Parameter-Efficient RL with Verifiable Rewards Specializes Compact LLMs for Structured Beam Mechanics Reasoning

JCG, PC

HSOLLC Co., Ltd.