[LG]《When Reasoning Traces Become Perfor

[LG]《When Reasoning Traces Become Performative: Step-Level Evidence that Chain-of-Thought Is an Imperfect Oversight Channel》W Li, F Yang, A Hazarika, S A. Mehta… [CMU & Fujitsu Research of America Inc] (2026)

在 CoT 监督中，可见推理链是否同步反映答案形成仍是难题。过去方法受困于整段级判断，本质原因是只问“解释是否可信”，没问“答案何时已被模型定下”。

本文的核心洞见是：把 CoT 重新看作“内部承诺与外部表述的时间对齐”。由此，逐步读取答案承诺信号，再分类错位形态，揭出大量承诺后的表演性续写。

这项工作真正留下的遗产是：CoT 可提升能力，却不能直接当作监督窗口。它为后来者打开的新门是区分承重推理与事后叙述，但尚未跨过的门槛是读数代理仍难覆盖全部内部语义。

arxiv.org/abs/2605.11746 机器学习人工智能论文 AI创造营

众力资讯网

[LG]《When Reasoning Traces Become Perfor

热门分类