我们知道推理模型在思考时有时会蹦出一些其他语言的文字。有的阴谋论会认为这是大模型

2026-04-12 16:13:18 蚁工厂科技

我们知道推理模型在思考时有时会蹦出一些其他语言的文字。有的阴谋论会认为这是大模型的“私有语言”，也有人认为可能这种更节省token。但这篇文章作者认为更合理的解释是，模型只是在模仿训练语料中人类快速做题时常见的速记风格，而不是走向真正不可理解的新语言网页链接作者用 DeepSeek 的链路举例，指出很多看似“压缩”的写法在 tokenizer 上并不更省 token，反而有时更差，这说明它们未必是最优编码，更像是继承了人类速记的粗糙痕迹，而链路里偶发的中英混杂和拼写错误，也更像双语人类草写推理时留下的印记。因此，文章的结论是“我们把人类自身那种潦草、压缩、密度变高的表达误认成了异质语言”。

阅读：0 点赞：0

众力资讯网

我们知道推理模型在思考时有时会蹦出一些其他语言的文字。有的阴谋论会认为这是大模型

热门分类