目前看到对DeepSeek真实水平最全面客观的分析（5）摘自基本常识谷歌的推理模

姬锋 2025-02-02 09:28:43

目前看到对DeepSeek真实水平最全面客观的分析（5）

摘自基本常识

谷歌的推理模型与 R1 相当

在人们为 R1 疯狂炒作时，一家市值 2.5 万亿美元的美国公司 —— 谷歌，提前一个月发布了一款推理模型 Gemini Flash 2.0 Thinking，且价格更低。这款模型可供使用，通过 API 调用时，即使其上下文长度更长，价格也比 R1 便宜得多。

在已公布的基准测试中，Flash 2.0 Thinking 的表现优于 R1，尽管基准测试并不能说明全部情况。谷歌只公布了 3 个基准测试结果，所以这只是一个不完整的画面。不过，我们认为谷歌的模型很可靠，在很多方面都能与 R1 抗衡，却没有得到任何炒作。这可能是因为谷歌的市场推广策略平淡无奇，用户体验也不佳，但也可能是因为 R1 来自中国，令人感到意外。

需要明确的是，这些都无损于深度求索的卓越成就。深度求索作为一家行动迅速、资金充足、人才济济且专注的初创公司，能够在推理模型发布上击败 Meta 等巨头，值得称赞。

技术成就

深度求索已经找到了关键方法，实现了领先实验室尚未取得的创新。我们预计，深度求索公布的任何改进，几乎都会立即被西方实验室效仿。

这些改进有哪些呢？大多数架构上的成就都与 V3 相关，V3 也是 R1 的基础模型。下面详细介绍这些创新成果。

0 阅读：11