年前还是认真推下DeepSeek吧。 V3已经用了一个月,但R1仅仅用了5天,不得不来发这条微博。先讲一句暴论:DeepSeek,可能是个国运级别的科技成果。 为了讲清楚这个成果有多惊人,我打个比方:如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破-- 1、强大。比肩01的推理能力,暂时没有之一 2、便宜。参数少,训练开销与使用费用小了一个数量级 3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型。 4、免费。官方目前提供的服务完全免费,任何人随时随地可用 5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持) 6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成
年前还是认真推下DeepSeek吧。 V3已经用了一个月,但R1仅仅用了5天,不
樱桃趣事
2025-01-28 05:52:00
0
阅读:0