看完马斯克的grok3发布会,确实让人很失望,之前说是地表最聪明的大模型,确实没毛病,因为在LMSYS平台的跑分上的确最高的1402分,gpt是1380分,deepseek-r1是1360分。 从得分上看,gpt只相差了1.4%,deepseek只相差了2.8%。但是grok3是用了20万张英伟达的H100芯片。gpt4只用了2.5万张H100,deepseek就更少了,只用了1万张a100,相当于0.2万张h100。 这10万张的H100芯片,一年的耗电量差不多等于一个小国家一整年的耗电量。但是提升只有1.4%。用了gpt几倍的能源,和ds几十倍的能源,结果就换来这么一点的提升,实在让人觉得之前的吹嘘有点让人过头了。

评论列表