Grok3能碾压DeepSeek吗在数学能力测试（AIME'24）中，Gro

之桃谈科技 2025-02-18 15:33:24

Grok3能碾压DeepSeek吗在数学能力测试（AIME'24）中，Grok-3 获得 52 分，DeepSeek-V3 为 39 分；科学知识评估（GPQA）方面，Grok-3 得 75 分，DeepSeek-V3 为 65 分；编程能力测试（LCB Oct - Feb）中，Grok-3 以 57 分超过 DeepSeek-V3 的 36 分。在 AIME 2025 性能测试中，Grok-3 Reasoning Beta 版本得 93 分，DeepSeek-R1 得 75 分。

从测试数据看，Grok3是比DeepSeek优秀，但是DeepSeek已经得到了国内外业界的广泛认可，也接受了用户的验证，而且更重要的是成本低，Grok3还只是厂商自卖自夸的阶段，还是等过段时间再作比较吧。

0 阅读：0

之桃谈科技

感谢大家的关注

作者最新文章

1

Grok3能碾压DeepSeek吗在数学能力测试（AIME'24）中，Gro

2

哪吒2全球影史票房第10 哪吒2上映20天，成功进入全球影史票房榜TOP10，

3

打工人如何缓解AI焦虑在AI飞速发展的当下，打工人很容易陷入被取代的焦虑。但

4

原来速食拉面也能吃得健康以前总觉得吃速食就别想健康，传统方便面那高盐高脂的问

5

NBA2K手游官宣定档刚看完2025NBA全明星赛，就看到NBA2K手游官宣

6

2025NBA全明星虽然退役多年，但是奥尼尔每年都会在全明星赛露脸。

7

哪吒2超117亿元今天估计是进不了TOP10了，明天是肯定能唱过《狮子王》，

8

DeepSeek翻译他强任他强清风拂山岗以下是我用DeepSeek翻译的：1

9

微信可一次性删除所有单向好友意思是10000人加满以后，再加人的时候提示加不

10

扣篮大赛麦克朗扣篮麦克朗扣篮确实厉害，不过他今年4个满分扣篮，我只觉得第

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

为什么央视不让苹果露出？在2024年春晚上，有一个细节值得注意，陈奕迅使用的

2

夸DeepSeek厉害可以，但是显得公务员很……难评

3

快来看巴黎人工智能峰会上的合影，冯德莱恩站C位，可她肩上那只手更抢镜。好多人都在

4

京东首个为外卖小哥上社保刘强东成给外卖骑手上社保第一人东哥进军外卖，要给

5

小米集团市值全球第100名目前仍然在爬升阶段，我估计还能够翻倍羡慕那些大赚特赚的

6

将DeepSeek接入Excel，实现一键做表

7

据网友爆料，广东湛江deepseek创始人梁文峰，除夕回乡过年，家乡人拉横幅

8

iPhone17系列将采用LTPO屏幕也就是说，标准版iPhone终于要放弃6

9

马斯克自曝死亡:凌晨3:00马斯克在自家的推特上预告死亡：有一些人想搞死我！随

10

iPhone全家福！2007-2025哪款iPhone最经典？！

科技最新文章

1

2千档的高性价比手机对比指南2000元左右的手机，这几款都很能打，配置拉满了，

2

【#中国空间站首个舱内在轨机器人试验#来了！】#这款机器人在空间站接受测评#新年

3

【航天中国空间站航天技术试验领域成功完成了空间站管道检测机器人在轨试验，验

4

第1名：拓维信息（153.95e）主入77.35e，出69.90e东数西算,华为

5

美团和京东大战最大的输家已经出现了！既不是美团，也不是京东，而是躲在角落

6

【几乎没有营销投入！DeepSeek上线一个月下载量破1亿Kimi、豆包遭遇冲

7

荣耀MagicV4发布消息确认了，这下oppo慌了基本上可以确认，荣耀Mag

8

iPhone17系列将采用LTPO屏幕也就是说，标准版iPhone终于要放弃6

9

波兰发布世界首个双足肌肉骨骼机器人有点过于惊悚了，这哪像机器人，倒是挺像木乃伊

10

任正非发言时激动哽咽：当年国家暗中出手，2600亿救华为！2019年，美国四