This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Fiona Lau

Articles by Fiona Lau

Academic · 1 min

Same Input, Different Scores: A Multi Model Study on the Inconsistency of LLM Judge

arXiv:2603.04417v1 Announce Type: new Abstract: Large language models are increasingly used as automated evaluators in research and enterprise settings, a practice known as LLM-as-a-judge. While …

Fiona Lau

19 views Mar 7

Fiona Lau

Articles by Fiona Lau

Same Input, Different Scores: A Multi Model Study on the Inconsistency of LLM Judge

JCG, PC

HSOLLC Co., Ltd.