目前看到对DeepSeek真实水平最全面客观的分析(5)摘自基本常识谷歌的推理模

姬锋 2025-02-02 09:28:43

目前看到对DeepSeek真实水平最全面客观的分析(5)

摘自基本常识

谷歌的推理模型与 R1 相当

在人们为 R1 疯狂炒作时,一家市值 2.5 万亿美元的美国公司 —— 谷歌,提前一个月发布了一款推理模型 Gemini Flash 2.0 Thinking,且价格更低。这款模型可供使用,通过 API 调用时,即使其上下文长度更长,价格也比 R1 便宜得多。

在已公布的基准测试中,Flash 2.0 Thinking 的表现优于 R1,尽管基准测试并不能说明全部情况。谷歌只公布了 3 个基准测试结果,所以这只是一个不完整的画面。不过,我们认为谷歌的模型很可靠,在很多方面都能与 R1 抗衡,却没有得到任何炒作。这可能是因为谷歌的市场推广策略平淡无奇,用户体验也不佳,但也可能是因为 R1 来自中国,令人感到意外。

需要明确的是,这些都无损于深度求索的卓越成就。深度求索作为一家行动迅速、资金充足、人才济济且专注的初创公司,能够在推理模型发布上击败 Meta 等巨头,值得称赞。

技术成就

深度求索已经找到了关键方法,实现了领先实验室尚未取得的创新。我们预计,深度求索公布的任何改进,几乎都会立即被西方实验室效仿。

这些改进有哪些呢?大多数架构上的成就都与 V3 相关,V3 也是 R1 的基础模型。下面详细介绍这些创新成果。

0 阅读:11
姬锋

姬锋

感谢大家的关注