Deepseek产业链交流要点(仅供更新参考): 1定位目标:打造中国最强的开源大模型,DeepSeek-V3目前参数规模670亿,商业化不是目前激进方向; 2投入:训练不到2个月,花费不到600万美元,完成DeepSeek-V3的训练,25年整体资本开支5-6亿; 3同行对比:DeepSeek还是属于大语言模型,跟ChatGPT、豆包的训练本身不在一个量级。现有的豆包或者智谱、KIMI、阿里通义千问,deepseek的逻辑推理能力还是强于它们,但是推理过程中情感化较弱; 4算力情况:2024年A100 1000张,H800 3300张,H20 2000多,910B 1000多张,2025年继续采购910C,H800,H109,A100,整体规划5000多张(华为910C 2000张);IDC:润泽科技廊坊今年提供了3000多个机柜;光模块交换机锦航科技;服务器浪潮信息,中科曙光;除了华为外,未来推理端可能用到寒武纪; 5推理侧:A100大概有4000多张卡,H800大概有2300张,大概有2000张H20,3090也有一部分; 6token收费情况:输入0.0001元/千token,输出0.016元/千token;日均调用量在30多亿; 7产业链合作:教育:科大讯飞;金融:拓尔思;办公:金山办公;其他:海天瑞声、卓创资讯、博彦科技、法本信息、中科软; 8模型升级:DeepSeek-R1是在DeepSeek-V3基础上蒸馏推理,总共花费230万美元,未来会采用多token的预测目标MTP形式,继续提升模型效率,2025Q4多模态能力可能突破; 9商业化构想:1)售卖token、售卖API接口,2)本地化私有部署,初步按45万/套/年的定价,支持中小企业客户的私有化应用,3)跟行业,比如金融、教育联合推出AI应用; token代理:目前接触并行科技、竞业达。
Deepseek产业链交流要点(仅供更新参考): 1定位目标:打造中国最强的开源
全产业
2025-02-05 00:11:36
0
阅读:53