【浙商计算机】周末Deepseek(简称DS)炸到外网周末Deepseek(简称

曼千谈商业 2025-01-27 17:13:50

【浙商计算机】周末Deepseek(简称DS)炸到外网

周末Deepseek(简称DS)炸到外网,最近发生啥了?听说Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释。

1、DS24年上半年最先发起大模型的价格战,24年12月发布Deepseek-v3基座,25年1月发布DeepSeekR1。现在海外大佬们都在测试和学习中。

2、DS坚持开源路线:DS-R1遵循MITLicense,允许用户自由地使用、修改和分享该模型,还开源了660B的DeepSeek-R1-Zero和DeepSeek-R1模型,以及蒸馏出的6个小模型(或影响了Meta成为开源之光:)。

3、DS低成本路线:其API服务定价远低于OpenAI的同类模型,每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,而GPT-o1模型每百万输入tokens15美元(约合人民币110元),每百万输出tokens60美元(约合人民币438元)。

4、DS-R1类比openAIo1,特点是:任何监督训练的纯强化学习路线。DS-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。

投资启示:国产大模型越来越惊艳,成本越来越低,国产应用还会远吗字节发布新版本豆包Doubaopro1.5,并且豆包早operator两天开源了同类的agent:UI-TARS。开源的Minimax-01。星火发布深度推理模型x1。Kimi也发布了多模态思考模型k1.5。我们相信国产爆款应用的大规模、有订单业绩的落地正在路上~!

对应标的:

1、25年金股:金山办公、科大讯飞。

2、近期亮点:万兴科技(数据亮眼)、虹软科技(业绩超预期)。

3、B端Agent:税友股份、焦点科技、彩讯股份、泛微网络、鼎捷数智、汉得信息、致远互联、博睿数据等。

4、港股:迈富时、金蝶国际、明源云等

0 阅读:39
曼千谈商业

曼千谈商业

感谢大家的关注