This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Haihui Pan, Yuzhong Hong, Shaoke Lv, Junwei Bao, Hongfei Jiang, Yang Song

Articles by Haihui Pan, Yuzhong Hong, Shaoke Lv, Junwei Bao, Hongfei Jiang, Yang Song

Academic · 1 min

Quality-constrained Entropy Maximization Policy Optimization for LLM Diversity

arXiv:2602.15894v1 Announce Type: new Abstract: Recent research indicates that while alignment methods significantly improve the quality of large language model(LLM) outputs, they simultaneously reduce the …

17 views Feb 20

Something extraordinary is coming.

Haihui Pan, Yuzhong Hong, Shaoke Lv, Junwei Bao, Hongfei Jiang, Yang Song

Articles by Haihui Pan, Yuzhong Hong, Shaoke Lv, Junwei Bao, Hongfei Jiang, Yang Song

Quality-constrained Entropy Maximization Policy Optimization for LLM Diversity

JCG, PC

HSOLLC Co., Ltd.