This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Abdul Wahab, Raksha Kumaraswamy, Martha White

Articles by Abdul Wahab, Raksha Kumaraswamy, Martha White

Academic · 1 min

Value Bonuses using Ensemble Errors for Exploration in Reinforcement Learning

arXiv:2602.12375v1 Announce Type: cross Abstract: Optimistic value estimates provide one mechanism for directed exploration in reinforcement learning (RL). The agent acts greedily with respect to …

26 views Mar 7

Abdul Wahab, Raksha Kumaraswamy, Martha White

Articles by Abdul Wahab, Raksha Kumaraswamy, Martha White

Value Bonuses using Ensemble Errors for Exploration in Reinforcement Learning

JCG, PC

HSOLLC Co., Ltd.