This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Taisuke Kobayashi

Articles by Taisuke Kobayashi

Academic · 1 min

Pseudo-Quantized Actor-Critic Algorithm for Robustness to Noisy Temporal Difference Error

arXiv:2604.01613v1 Announce Type: new Abstract: In reinforcement learning (RL), temporal difference (TD) errors are widely adopted for optimizing value and policy functions. However, since the …

Taisuke Kobayashi

8 views Apr 3

Taisuke Kobayashi

Articles by Taisuke Kobayashi

Pseudo-Quantized Actor-Critic Algorithm for Robustness to Noisy Temporal Difference Error

JCG, PC

HSOLLC Co., Ltd.