众力资讯网

我们知道推理模型在思考时有时会蹦出一些其他语言的文字。有的阴谋论会认为这是大模型

我们知道推理模型在思考时有时会蹦出一些其他语言的文字。有的阴谋论会认为这是大模型的“私有语言”,也有人认为可能这种更节省token。但这篇文章作者认为更合理的解释是,模型只是在模仿训练语料中人类快速做题时常见的速记风格,而不是走向真正不可理解的新语言网页链接 作者用 DeepSeek 的链路举例,指出很多看似“压缩”的写法在 tokenizer 上并不更省 token,反而有时更差,这说明它们未必是最优编码,更像是继承了人类速记的粗糙痕迹,而链路里偶发的中英混杂和拼写错误,也更像双语人类草写推理时留下的印记。因此,文章的结论是“我们把人类自身那种潦草、压缩、密度变高的表达误认成了异质语言”。