AI是模拟智能的输出，能力上限在摸索，理解是关键1.Deepseek展示了思维

AI是模拟智能的输出，能力上限在摸索，理解是关键

1. Deepseek展示了思维链，显示了惊人的文字能力。对于AI的兴趣再次高涨，AI有没有灵魂，能不能很快开发出AGI、ASI，问题价值极大。好事是，大模型的“技术秘密”基本清楚了。这也是Deepseek的贡献，OpenAI闭源制造神秘感失败。

2. 高水平AI架构都是基于Transfomer的，建立大段内容中词元（token）与词元之间的复杂关联。一段内容，所有token互相之间都有权重系数指出关联大小，而且还有多达128重视角去建立不同角度的关联。

3. 大模型用多达2万个大矩阵去记载这些关联，每个矩阵是7000*7000规模的，5000万个系数。人类知识被压缩进这些矩阵里了。这就是Deepseek R1满血版是671B的意思，B是billion，10亿。

4. 一个方向是，继续增多系数，如几万亿个，记载更多人类知识。这条路可能到头了，主要的知识已经在训练素材里了。很多东西是数据，如每天股票交易价格波动，不是关键知识。有新知识的论文也不多。人们写的文章往往是旧知识的排列组合。新发生的事，联网搜索就可以了，不需要立刻训练进系数里。

5. 现在热点转向了，在大模型知识体系里，加强输出效果。这包括，写诗写文追赶文豪，做题编程人类顶尖，科学知识水平超过领域内博士，更能分辨互联网真假信息，任务非常多。再深入，就用大模型来规划复杂任务，进行越来越长的思维，步骤越来越多。

6. 不少人相信，思维能力超过所有人类、什么领域都最强的AGI通用人工智能、ASI超级智能，很快就出来了，乐观一年，正常两三年。业界态度大幅转向乐观了。特别是“只给题目答案不给过程，让大模型自己思考摸索”的成功，让人们看到了机器自学的新路。

7. 个人认为，现在这些大模型成果，都是模拟智能。把输出训练调试得像是高水平思维的结果。它里面在搞无数个矩阵乘法，人类肯定不是这么思考的。人类思考也等于是文字输出，大模型思维链就是模仿这些中间结果输出。模仿得很好，甚至超过普通人的思维水平。这就是矩阵关联模仿的威力。

8. 不过这还是以计算来模仿思维输出的套路，模拟智能的输出。真正的问题还是理解。人类理解问题，基于自然界物理信号，而不是概念之间的关联。原始人，也可以比划交流，大家对物理世界有同一的理解。大模型无法真正理解概念，只是一个关联计算器。你要问它什么是感觉，它会说出来现象，但不知道感觉是什么。

9. 因此，我认为大模型是“关联探索器”。可以模仿很多人类已经建立的关联，但是很难凭空造出一个新东西，建立新的包含智慧的关联。因此，大模型还不是高级智能，如没法证明未知数学难题（人类也不知道答案），因为需要构建一个复杂的证明体系，里面有非常深刻的洞察。它也很难构建一个很复杂的人类社会群落，写出很好看的剧本和小说。这些都需要人类的灵魂和感觉。

0 阅读：382