DeepSeek为何一夜爆火如果AI真的要介入各行各业,就不可避免的会涉及

阳云聊情感 2025-01-26 12:20:37

DeepSeek为何一夜爆火 如果 AI真的要介入各行各业,就不可避免的会涉及到断网环境,不可避免的要你自己调。那你几乎一定要用开源模型,用开源部署方案,你也一定会从开源方案开始学习大模型原理。

以前每次遇到这种机会,都是美国占尽先机。Android是一次,Pytorcht是一次。他先做的最好,然后所有人都用这个,他就变成事实标准了。后面再怎么折腾都没戏,比如Windows phone和JAX。本来这次也是历史重演的轮回,看上去开源事实标准这个东西再一次要被 meta拿走了。

结果没成想qwent强势出圈。私以为Ilama只是占着美国本土公司的天时和大多数nlp任务是英语的地利才堪堪与 qwen平起平坐。要换个中文qwen真是把 llama吊着打。现在AI顶会一半的文章都是中国人写的,他们工作后的惯性影响一定是深远的。

然后9月 o1发布,核心技术路线四个月过去直接被 deepseek搞了出来,全部开源。之前还说700b的模型又是专属架构我们跑不了,这回直接发蒸馏模型,vllm加速之类的全部兼容。下个月aclt截稿,要是这两天不紧急把ds的实验补上去保不齐都会有审稿人蛐蛐。

这意味着以后全世界的工程师都可能会从qwen和 ds开始学习大模型。如果这个趋势有幸保持,我们或许可以看到互联网产业第一次由中国公司掌握基建标准的案例。

0 阅读:91
阳云聊情感

阳云聊情感

感谢大家的关注