AI是模拟智能的输出,能力上限在摸索,理解是关键1.Deepseek展示了思维

烨华聊商业 2025-02-13 09:23:20

AI是模拟智能的输出,能力上限在摸索,理解是关键

1. Deepseek展示了思维链,显示了惊人的文字能力。对于AI的兴趣再次高涨,AI有没有灵魂,能不能很快开发出AGI、ASI,问题价值极大。好事是,大模型的“技术秘密”基本清楚了。这也是Deepseek的贡献,OpenAI闭源制造神秘感失败。

2. 高水平AI架构都是基于Transfomer的,建立大段内容中词元(token)与词元之间的复杂关联。一段内容,所有token互相之间都有权重系数指出关联大小,而且还有多达128重视角去建立不同角度的关联。

3. 大模型用多达2万个大矩阵去记载这些关联,每个矩阵是7000*7000规模的,5000万个系数。人类知识被压缩进这些矩阵里了。这就是Deepseek R1满血版是671B的意思,B是billion,10亿。

4. 一个方向是,继续增多系数,如几万亿个,记载更多人类知识。这条路可能到头了,主要的知识已经在训练素材里了。很多东西是数据,如每天股票交易价格波动,不是关键知识。有新知识的论文也不多。人们写的文章往往是旧知识的排列组合。新发生的事,联网搜索就可以了,不需要立刻训练进系数里。

5. 现在热点转向了,在大模型知识体系里,加强输出效果。这包括,写诗写文追赶文豪,做题编程人类顶尖,科学知识水平超过领域内博士,更能分辨互联网真假信息,任务非常多。再深入,就用大模型来规划复杂任务,进行越来越长的思维,步骤越来越多。

6. 不少人相信,思维能力超过所有人类、什么领域都最强的AGI通用人工智能、ASI超级智能,很快就出来了,乐观一年,正常两三年。业界态度大幅转向乐观了。特别是“只给题目答案不给过程,让大模型自己思考摸索”的成功,让人们看到了机器自学的新路。

7. 个人认为,现在这些大模型成果,都是模拟智能。把输出训练调试得像是高水平思维的结果。它里面在搞无数个矩阵乘法,人类肯定不是这么思考的。人类思考也等于是文字输出,大模型思维链就是模仿这些中间结果输出。模仿得很好,甚至超过普通人的思维水平。这就是矩阵关联模仿的威力。

8. 不过这还是以计算来模仿思维输出的套路,模拟智能的输出。真正的问题还是理解。人类理解问题,基于自然界物理信号,而不是概念之间的关联。原始人,也可以比划交流,大家对物理世界有同一的理解。大模型无法真正理解概念,只是一个关联计算器。你要问它什么是感觉,它会说出来现象,但不知道感觉是什么。

9. 因此,我认为大模型是“关联探索器”。可以模仿很多人类已经建立的关联,但是很难凭空造出一个新东西,建立新的包含智慧的关联。因此,大模型还不是高级智能,如没法证明未知数学难题(人类也不知道答案),因为需要构建一个复杂的证明体系,里面有非常深刻的洞察。它也很难构建一个很复杂的人类社会群落,写出很好看的剧本和小说。这些都需要人类的灵魂和感觉。

0 阅读:117

猜你喜欢

烨华聊商业

烨华聊商业

感谢大家的关注