Grok3能碾压DeepSeek吗 在数学能力测试(AIME'24)中,Grok-3 获得 52 分,DeepSeek-V3 为 39 分;科学知识评估(GPQA)方面,Grok-3 得 75 分,DeepSeek-V3 为 65 分;编程能力测试(LCB Oct - Feb)中,Grok-3 以 57 分超过 DeepSeek-V3 的 36 分。在 AIME 2025 性能测试中,Grok-3 Reasoning Beta 版本得 93 分,DeepSeek-R1 得 75 分。
从测试数据看,Grok3是比DeepSeek优秀,但是DeepSeek已经得到了国内外业界的广泛认可,也接受了用户的验证,而且更重要的是成本低,Grok3还只是厂商自卖自夸的阶段,还是等过段时间再作比较吧。