郭明錤:DeepSeek推动生成式AI产业进入新阶段:算力增长新动力与应用多元化 DeepSeek-R1发布后,有以下两个重要的AI产业新趋势值得关注。即便没有DeepSeek-R1,这两个趋势最终也会明显显现,但DeepSeek-R1的出现加速了它们的发生。 1. 在缩放定律(Scaling law)边际效益放缓时,AI算力仍可通过优化训练方式持续增长,并有助于挖掘新应用。 2. API/Token价格显著下降,有利于AI软件/服务以及设备端AI,加速AI应用多元化。 趋势一:缩放定律边际效益放缓时,AI算力仍可通过优化训练方式持续增长,并有助于挖掘新应用 1. 在过去1 - 2年,投资者对AI服务器供应链的投资逻辑主要基于在缩放定律成立的情况下,AI服务器出货量能够持续增长。然而,缩放定律的边际效益正在逐渐递减,这使得市场更加关注DeepSeek如何通过缩放定律以外的方式显著提升模型效益。 2. 最常被引用的Chinchilla缩放定律指出,AI模型性能由模型参数数量(N)、训练数据量(D)与运算能力(C)三者决定,最理想的情况是N、D与C同时增加。 3. 缩放定律对提升模型性能边际效益放缓的原因:1)人类创作的文本数据(D)几乎已耗尽;2)在运算能力(C)没有大幅提升且训练数据量(D)耗尽的情况下,仅提升模型参数数量(N)对模型效能并无帮助;3)运算能力(C)短期内不易显著提升(例如Blackwell系统尚未量产、电力供应受限等原因)。 4. 从产业研究的角度来看,DeepSeek-R1值得关注的地方在于,该大语言模型(LLM)通过优化训练方式而非缩放定律显著提升了模型效益,这可以通过检视和测试其开源成果来验证。 5. 缩放定律的边际效益终有递减的时候,此时通过优化训练方式来提升模型效益,有助于持续提升AI基础设施的算力并挖掘新应用。对于AI产业的长期发展而言,两者缺一不可。 趋势二:API/Token价格显著下降,有利于AI软件/服务以及设备端AI,加速AI应用多元化 1. 目前,从生成式AI趋势中获利的方式,主要还是靠卖铲子(提供基础工具和服务)和降低成本,而非创造新业务或提升既有业务的附加值。 2. DeepSeek-R1采取激进的定价策略,可免费使用,且其API/token定价最低不到OpenAI-o1的1/100,这种竞争压力可能会带动AI使用成本下降。中国AI产业市场竞争激烈,预计会看到其他中国厂商推出跑分优异且定价更激进的大语言模型。 3. 近期,AI供应链相关股票大幅调整,主要原因是投资者因缩放定律边际效益放缓,调整了对AI服务器出货量的预期,产生负面影响,而非担忧大语言模型服务供应商和云服务提供商(CSP)能否通过AI获利,因为大多数投资者仍愿意耐心等待获利时刻的到来。 4. 由于API/Token价格下降和训练方法优化,AI软件/服务以及设备端AI的成本降低,这有助于增加AI算力需求,并能减轻投资者对AI投资能否获利的疑虑。 5. AI使用量肯定会因价格下降而增加,但增加的幅度能否抵消价格下滑的幅度仍有待观察。此外,AI使用量的提升有助于创造可获利的商业模式,但这也并非绝对。不过,鉴于投资者普遍仍愿意耐心等待获利出现,目前可以忽略上述顾虑。 结论: 1. 缩放定律是一种经验法则,合理降低预期并理性看待,反而有利于长期投资趋势。芯片升级(C)、改善电力供应限制(C)以及在训练中引入更多多模态数据(D)等,都有利于未来再次提升缩放定律的边际效益。 2. 只有大量部署者才会遇到缩放定律边际效应放缓的情况,这也再次验证了英伟达(Nvidia)的领先地位。等到英伟达方案的缩放定律边际效益再次加速时,预计届时其优势(相较于ASIC和AMD)将更加显著。 3. 近期GB200 NVL72量产不顺,因此此时调整对缩放定律和AI服务器出货量的预期并非坏事。此次股价调整后,后续更有利于反映GB300/Rubin带来的利好。 4. 一线云服务提供商(CSP)不会仅仅因为有了更好的训练方式就削减资本支出,因为两者并不冲突。此时若放缓资本支出,等到缩放定律边际效益再次加速时,就会落后于竞争对手。 5. 开放的社群资源以及中国激烈的竞争环境,预计会看到其他中国厂商推出跑分优异且定价更激进的大语言模型。届时,如果大语言模型服务供应商还未开始稳定获利,获利压力将进一步增大。 6. 受益于API/Token价格显著下降,AI软件/服务以及设备端AI将吸引更多投资者关注。而它们能否成为新的长期投资趋势,取决于能否创造可获利的商业模式。 7. 英伟达仍是未来缩放定律边际效益再次加速时的赢家,但需要关注短期GB200 NVL72的量产问题,以及中长期美国半导体出口禁令是否会有变化。
郭明錤:DeepSeek推动生成式AI产业进入新阶段:算力增长新动力与应用多元化
丹萱谈生活文化
2025-01-30 21:47:28
0
阅读:7