DeepSeek闯入竞技榜前三,中国原创科技能否迈向世界前列?! 近期,位于杭州的DeepSeek公司旗下的DeepSeek - R1在大模型竞技榜中表现令人惊艳,成功跻身前三,与ChatGPT - 4o并列,在复杂提示词/风格控制榜单上荣登榜首,在WebDev分榜上位居第二。 于去年年末推出的DeepSeek - V3,据聊天机器人竞技场(ChatbotArena)的数据显示,在所有模型里排名第七,于开源模型中位列第一,是全球排名前十的模型里性价比最高的。 其核心技术创新整合了Multi - headLatentAttention(MLA)、混合专家架构(MoE)和FP8低精度训练这三项技术,提升了性能与效率,并且训练成本仅为558万美元,远低于GPT - 4的7800万美元。其API服务价格实惠,输入tokens每百万仅需0.5元(缓存命中时)或者2元(缓存未命中时),输出tokens每百万仅需8元。 1月20日正式开源R1推理模型,1月24日DeepSeek - R1在ChatbotArena综合榜单上名列第三,在多个技术性很强的领域表现优异。 DeepSeek的成果引发了一系列现象,Meta的员工称DeepSeek - V3的出现让Meta内部陷入恐慌模式,工程师们争分夺秒地分析DeepSeek以试图复制技术,Meta的扎克伯格、图灵奖得主YannLeCun以及DeepmindCEO DemisHassabis等人都对DeepSeek给予了高度评价。 DeepSeek创始人梁文锋在2023年5月 - 2024年7月接受采访时提及的一些理念也备受外界关注,例如DeepSeek专注于基础的AGI研究和创新第一性原则;DeepSeekV2采用的新型MLA架构降低显存占用,实现成本大幅降低的革命性架构理念;保持完全自下而上的组织结构,依据创造热情优先选拔人才的独特公司文化和人才战略;尽管行业趋向闭源,仍致力于开源的理念;以及面临高端算力使用权受限的底层计算挑战等。 DeepSeek的成功是中国原创科技发展的一个写照。 从资源投入的角度来看,中国在资金资源投入方面有一定的基础,但在高端科技研发领域或许还需要更多的资金,在人力资源方面,中国拥有庞大的科技工作者队伍,并且人才策略创新非常重要;在政策支持层面,政府的战略规划、政策保障(包括资金扶持和法规保护)对原创科技发展意义非凡;在文化底蕴和科研氛围构建方面,传承创新文化传统、提升对失败的包容度必不可少;完善科技基础设施(包括硬件设施和技术服务平台)也极为必要。 硅谷从创新文化、产业生态、资本环境方面对中国原创科技发展有着不同的看法,既承认挑战,也思考借鉴意义。 中国原创科技发展具有C端驱动、人才和成本、政策支持等优势,同时也面临高端技术瓶颈、国际竞争压力、知识产权保护国际认可度、科研环境优化等挑战。 总之,DeepSeek的成绩让人们看到了中国原创科技的潜力,但要走向世界前列还需克服诸多挑战。 AI大模型开源 iata代码 高性能开发 深度学习开发 开源大语言模型 itep内测 biopen 完整开源 开源开放生态
DeepSeek闯入竞技榜前三,中国原创科技能否迈向世界前列?! 近期,位于杭州
沁沁随心生活
2025-01-26 22:12:04
0
阅读:118