众力资讯网

[LG]《When Reasoning Traces Become Perfor

[LG]《When Reasoning Traces Become Performative: Step-Level Evidence that Chain-of-Thought Is an Imperfect Oversight Channel》W Li, F Yang, A Hazarika, S A. Mehta… [CMU & Fujitsu Research of America Inc] (2026)

在 CoT 监督中,可见推理链是否同步反映答案形成仍是难题。过去方法受困于整段级判断,本质原因是只问“解释是否可信”,没问“答案何时已被模型定下”。

本文的核心洞见是:把 CoT 重新看作“内部承诺与外部表述的时间对齐”。由此,逐步读取答案承诺信号,再分类错位形态,揭出大量承诺后的表演性续写。

这项工作真正留下的遗产是:CoT 可提升能力,却不能直接当作监督窗口。它为后来者打开的新门是区分承重推理与事后叙述,但尚未跨过的门槛是读数代理仍难覆盖全部内部语义。

arxiv.org/abs/2605.11746 机器学习 人工智能 论文 AI创造营