This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Attila Dobi, Aravindh Manickavasagam, Benjamin Thompson, Xiaohan Yang, Faisal Farooq

Articles by Attila Dobi, Aravindh Manickavasagam, Benjamin Thompson, Xiaohan Yang, Faisal Farooq

Academic · 1 min

Measuring the Prevalence of Policy Violating Content with ML Assisted Sampling and LLM Labeling

arXiv:2602.18518v1 Announce Type: new Abstract: Content safety teams need metrics that reflect what users actually experience, not only what is reported. We study prevalence: the …

5 views Feb 25

Something extraordinary is coming.

Attila Dobi, Aravindh Manickavasagam, Benjamin Thompson, Xiaohan Yang, Faisal Farooq

Articles by Attila Dobi, Aravindh Manickavasagam, Benjamin Thompson, Xiaohan Yang, Faisal Farooq

Measuring the Prevalence of Policy Violating Content with ML Assisted Sampling and LLM Labeling

JCG, PC

HSOLLC Co., Ltd.