This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Liang Chen, Qi Liu, Wenhuan Lin, Feng Liang

Articles by Liang Chen, Qi Liu, Wenhuan Lin, Feng Liang

Academic · 1 min

Criterion Validity of LLM-as-Judge for Business Outcomes in Conversational Commerce

arXiv:2604.00022v1 Announce Type: cross Abstract: Multi-dimensional rubric-based dialogue evaluation is widely used to assess conversational AI, yet its criterion validity -- whether quality scores are …

2 views Apr 3

Liang Chen, Qi Liu, Wenhuan Lin, Feng Liang

Articles by Liang Chen, Qi Liu, Wenhuan Lin, Feng Liang

Criterion Validity of LLM-as-Judge for Business Outcomes in Conversational Commerce

JCG, PC

HSOLLC Co., Ltd.