This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Amirhossein Roknilamouki, Arnob Ghosh, Eylem Ekici, Ness B. Shroff

Articles by Amirhossein Roknilamouki, Arnob Ghosh, Eylem Ekici, Ness B. Shroff

Academic · 1 min

Escaping Offline Pessimism: Vector-Field Reward Shaping for Safe Frontier Exploration

arXiv:2603.18326v1 Announce Type: new Abstract: While offline reinforcement learning provides reliable policies for real-world deployment, its inherent pessimism severely restricts an agent's ability to explore …

6 views Mar 20

Amirhossein Roknilamouki, Arnob Ghosh, Eylem Ekici, Ness B. Shroff

Articles by Amirhossein Roknilamouki, Arnob Ghosh, Eylem Ekici, Ness B. Shroff

Escaping Offline Pessimism: Vector-Field Reward Shaping for Safe Frontier Exploration

JCG, PC

HSOLLC Co., Ltd.