中国Deepseek为何震惊了国内外，特别是美国人？①性能卓越。比肩顶尖模型：D

字母科技 2025-01-27 11:31:37

中国Deepseek为何震惊了国内外，特别是美国人？

①性能卓越。比肩顶尖模型：DeepSeek-R1在数学、代码、自然语言推理等任务上，性能可与OpenAI的GPT-4o、Claude-3.5等顶尖闭源模型相媲美，在AIME 2024和CNMO 2024等数学测试中还超越了所有已知的开源和闭源模型。

② 训练资金少：DeepSeek仅花费约600万美元就完成了新模型的训练，而OpenAI每年的花费估计高达50亿美元，谷歌2024年的预计资本支出更是超过500亿美元。

③算力需求低。只用了2048张英伟达H100的GPU集群，53天就完成训练，在面临美国对中国实施半导体出口管制的情况下，DeepSeek使用相对普通的H800芯片也能训练出高性能的模型。

④方便复现：加州大学伯克利分校、香港科技大学、HuggingFace等纷纷成功复现DeepSeek成果，只用强化学习，没有监督微调，甚至几十美元的成本就能完成复现，这在AI领域是极为罕见的。

⑤高效低成本。采用混合专家架构，将模型拆分为256个“专家模块”，每个模块专精特定领域，通过稀疏激活机制，每次推理仅激活5%的专家模块，算力消耗降低90%。

抛弃传统的“预训练+监督微调”模式，改用纯强化学习驱动的训练模式，让AI像打游戏一样自主升级，通过不断试错寻找最优路径，无需高价聘请人类标注答案，数据成本降低95%。

⑥打破了美国对中国AI技术封锁。美国对中国实施半导体出口管制，限制高性能芯片对中国的出口DeepSeek在受限情况下，使用H800等相对普通的芯片，仅用2048张英伟达H100的GPU集群，53天就完成训练，取得重大突破，打破了美国认为限制芯片就能限制中国AI发展的想法。

⑦对美国AI发展理念冲击巨大。美国AI发展模式注重大量资金、算力和数据投入，DeepSeek则通过创新算法、架构和训练策略，用较少资源实现高性能，为AI发展提供新方向，让美国反思其发展理念和路径，不再认为高投入是AI成功的唯一途径。

0 阅读：0

感谢大家的关注

作者最新文章

1

目前大众把DeepSeek吹的太神了，它最大的创新是颠覆了大模型的发展方向，通过

2

特朗普称将来美国可能大幅扩张建议大漂亮吞并欧洲、日本、加拿大，想想就美[哈哈]

3

中国Deepseek为何震惊了国内外，特别是美国人？①性能卓越。比肩顶尖模型：D

4

韩公布济州航空空难初步调查报告总结下①飞机双发动机都撞鸟了②飞机以高速度机腹着

5

合肥地震，肥东县，3.0级，这是今年第二次地震了。去年我记得合肥也是地震了四五次

6

颜十六已到案回国原名颜文磊，江苏人，上个月还回过家。本来是小导演，后来竟然利用

7

柯洁直播哭了柯洁之所以哭了，因为在面对韩国棋协他是渺小的，甚至很多国人也不理解

8

王大发曝张大大曾在机场打助理现在看来，这个张大大人品真是低劣，打人、恐吓、爆粗

9

比尔盖茨说离婚后成了空巢老人空巢老人有点扯，有老婆时，比尔盖茨就出轨多人，包括

10

周鸿祎官宣送100辆国产新能源车最后大概率是变相的打广告，周鸿祎涨粉，车厂赞助

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

为什么央视不让苹果露出？在2024年春晚上，有一个细节值得注意，陈奕迅使用的

2

夸DeepSeek厉害可以，但是显得公务员很……难评

3

快来看巴黎人工智能峰会上的合影，冯德莱恩站C位，可她肩上那只手更抢镜。好多人都在

4

京东首个为外卖小哥上社保刘强东成给外卖骑手上社保第一人东哥进军外卖，要给

5

小米集团市值全球第100名目前仍然在爬升阶段，我估计还能够翻倍羡慕那些大赚特赚的

6

将DeepSeek接入Excel，实现一键做表

7

据网友爆料，广东湛江deepseek创始人梁文峰，除夕回乡过年，家乡人拉横幅

8

iPhone17系列将采用LTPO屏幕也就是说，标准版iPhone终于要放弃6

9

马斯克自曝死亡:凌晨3:00马斯克在自家的推特上预告死亡：有一些人想搞死我！随

10

iPhone全家福！2007-2025哪款iPhone最经典？！

科技最新文章

1

【#中国空间站首个舱内在轨机器人试验#来了！】#这款机器人在空间站接受测评#新年

2

【航天中国空间站航天技术试验领域成功完成了空间站管道检测机器人在轨试验，验

3

【几乎没有营销投入！DeepSeek上线一个月下载量破1亿Kimi、豆包遭遇冲

4

荣耀MagicV4发布消息确认了，这下oppo慌了基本上可以确认，荣耀Mag

5

iPhone17系列将采用LTPO屏幕也就是说，标准版iPhone终于要放弃6

6

波兰发布世界首个双足肌肉骨骼机器人有点过于惊悚了，这哪像机器人，倒是挺像木乃伊

7

老爸用了5年的手机最近很卡，然后我妈给他在网上买了个小米k80，拿到手机后我妈突

8

虽然xai没有公布Grok-3训练的全部细节。但是，已知的集群大小（100k

9

夸DeepSeek厉害可以，但是显得公务员很……难评

10

美团突然宣布交设保，饿了么慌了！你们发现没有？美团给外卖小哥交设保，最慌的不