李飞飞团队用不到50美元训练出媲美DeepSeekR1的AI推理模型 点评:

丹萱谈生活文化 2025-02-07 07:48:52

李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型 点评:李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。昨天国内AI又投了一颗深水炸弹!有研究人员表示,自己仅用了50美元就训练出媲美DeepSeek R1的AI推理模型。甚至在竞赛数学问题上的表现比OpenAI的o1-preview高出27%。但随后记者辟谣说,该团队“并非从零开始训练”,其基座模型为“阿里通义千问模型”。而且号称50美元训练仅仅是云计算服务费用,不包括服务器、显卡等硬件投入费用,这些由云厂商承担!虽然有夸大成分,但也说明通过AI算法优化+模型蒸馏技术,完全可以打破英伟达高端芯片的垄断。可以预见未来AI会有两大趋势:1、算力统一由云厂商提供;2、AI应用会全面爆发。

0 阅读:3