Grok3能碾压DeepSeek吗
看了一下... Grok3 完全和 DeepSeek 不是一个路子啊。
Grok3 还是「力大砖飞」,10 万张 H100 + 合成数据,继续信仰 Scaling Law, 搞完之后看跑分确实很nb,而且也支持思维链和多模态。
但是跑分的意义应该越来越小了吧,靠堆数据和卷算力提升,边际效应递减是必然的,成本反而成了劣势。
DeepSeek R1 真的吊打 GPT O1 Pro 吗?很显然有没有,但是 DeepSeek 强就强在成本低 + 开源,这样才有了「遍地开花」的结果。
我觉得大模型的未来应该还是寄托在新的范式,而不是继续怼算力和数据...