This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Orin Levy, Aviv Rosenberg, Alon Cohen, Yishay Mansour

Articles by Orin Levy, Aviv Rosenberg, Alon Cohen, Yishay Mansour

Academic · 1 min

Near-Optimal Regret for Policy Optimization in Contextual MDPs with General Offline Function Approximation

arXiv:2602.13706v1 Announce Type: new Abstract: We introduce \texttt{OPO-CMDP}, the first policy optimization algorithm for stochastic Contextual Markov Decision Process (CMDPs) under general offline function approximation. …

4 views Feb 18

Something extraordinary is coming.

Orin Levy, Aviv Rosenberg, Alon Cohen, Yishay Mansour

Articles by Orin Levy, Aviv Rosenberg, Alon Cohen, Yishay Mansour

Near-Optimal Regret for Policy Optimization in Contextual MDPs with General Offline Function Approximation

JCG, PC

HSOLLC Co., Ltd.