This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Fan Huang, Haewoon Kwak, Jisun An

Articles by Fan Huang, Haewoon Kwak, Jisun An

Academic · 1 min

Understanding Moral Reasoning Trajectories in Large Language Models: Toward Probing-Based Explainability

arXiv:2603.16017v1 Announce Type: new Abstract: Large language models (LLMs) increasingly participate in morally sensitive decision-making, yet how they organize ethical frameworks across reasoning steps remains …

38 views Mar 18

Fan Huang, Haewoon Kwak, Jisun An

Articles by Fan Huang, Haewoon Kwak, Jisun An

Understanding Moral Reasoning Trajectories in Large Language Models: Toward Probing-Based Explainability

JCG, PC

HSOLLC Co., Ltd.