众力资讯网

各大国际投行深度拆解Deepseek |投行原文

▪️Jefferies:中国深度求索引发的担忧——人工智能投资回报率

深度求索(DS)由中国一家非常成功的由人工智能驱动的量化基金High - Flyer 100%持股。High - Flyer于2023年4月创建DS,专注于通用人工智能(AGI)/大语言模型。2024年5月推出V2版本,据报道每个输出标记的成本仅为2元人民币。它在滑铁卢大学的LLM排行榜上排名第7。上个月推出了V4版本,在14.8万亿个标记的数据集上进行训练(GPT4 - o为13万亿个),训练成本仅为560万美元(假设H800每小时租金为2美元),不到Meta的Llama成本的10%。DS还表示,V3的性能超过了Llama 3.1和Qwen 2.5,与GPT4o和Claude 3.5 Sonnet相当。DS的架构基于专家混合模型和多头潜在注意力机制。每个MoE模型约有2000亿个数据参数,每个查询仅激活约200亿个参数,这降低了推理成本并缩短了响应时间。它是一个开源模型,可在Hugging Face上获取,因此其他人工智能开发者可以使用它。我们认为V3将使开发者能够以低得多的成本开发应用程序。然而,DS并不专注于商业化,也没有加速任何人工智能的商业化。

对计算能力需求的影响

市场自然会担心计算能力的需求增长。我们一直强调对人工智能投资回报率的担忧,因为对GPU的巨额投资,但没有具体的人工智能商业化案例来证明这些投资是合理的。我们认为DS的成功可能会推动两种可能的行业策略:1)仍然追求更多的计算能力以推动更快的模型改进;2)重新关注效率和投资回报率,这意味着到2026年对计算能力的需求将会降低。在资本市场充裕的情况下,海外人工智能公司一直在不惜一切代价追求模型改进。但DS可能会促使投资者对这些计算能力投资提出尖锐的问题。因此,美国人工智能企业的管理层在证明2026年进一步增加人工智能资本支出的合理性方面可能会面临更大的压力。

人工智能供应链(即GPU、服务器原始设计制造商、印刷电路板、液体冷却)极易受到评级下调的影响。专用集成电路(ASIC)/高带宽内存(HBM)/电源/数据中心则更具弹性。

全文参考附图…