【华西证券-计算机行业周报:DeepSeek~V4强化国产算力适配】研究报告内容摘要 本周观点:
一、DeepSeek-V4上线并开源,百万上下文与Agent能力升级推升推理算力需求
本周AI产业链值得关注的变化,在于DeepSeek-V4发布进一步强化了长上下文、Agent和复杂推理方向。4月24日,DeepSeek-V4预览版本正式上线并同步开源,模型上下文处理长度由128K扩展至1M,支持百万字超长上下文,同时输出长度最大为384K tokens;本次DeepSeek-V4首次增加KVCache滑窗和压缩算法,以减少Attention计算和访存开销,并通过模型架构创新更好支持Agent和Coding场景。
我们认为,DeepSeek-V4的发布说明国内开源大模型仍在快速迭代,且模型竞争重点正在从通用对话能力,进一步转向长上下文处理、代码生成、工具调用和多步骤任务执行。随着办公Agent、代码Agent、企业知识库和具身Agent等场景扩张,推理侧Token消耗、调用次数和并发压力有望持续提升。
二、昇腾超节点全面支持DeepSeek-V4,国产算力从模型适配走向规模化推理验证
DeepSeek-V4发布后,华为昇腾超节点的同步适配成为本周国产算力主线。华为官微发文称,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,并结合多种量化算法,实现高吞吐、低时延的DeepSeek V4模型推理部署;昇腾A3超节点系列产品也全面适配,并提供基于昇腾A3超节点的训练参考实现。
我们认为,这说明国产算力适配已经从“模型能否运行”,进入“长上下文、低时延、高吞吐、可微调”的工程化验证阶段。对DeepSeek-V4这类长上下文和Agent模型而言,推理系统面临的压力不只是单卡算力,还包括显存容量、KVCache管理、跨卡通信、请求调度和长序列Attention开销。昇腾超节点通过高速互联、统一调度和软硬件协同,有望提升复杂模型在企业级和云端推理场景中的可部署性。
另外,寒武纪、摩尔线程及FlagOS同步适配,国产AI芯片生态协同继续加快。除华为昇腾外,寒武纪、摩尔线程等国产AI芯片生态也在本周同步适配DeepSeek-V4。寒武纪已基于vLLM推理框架完成对285BDeepSeek-V4-Flash和1.6TDeepSeek-V4-Pro的Day 0适配,适配代码已开源到GitHub社区;摩尔线程携手智源FlagOS,为旗舰级AI训推一体全功能GPUMTTS5000完成DeepSeek-V4-Flash模型Day-0适配。FlagOS方面,众智FlagOS已完成DeepSeek-V4-Flash在8款以上AI芯片上的全量适配与推理部署,并正在推进DeepSeek-V4-Pro在多个芯片上的迁移适配。
我们认为,DeepSeek-V4并非只带动单一硬件厂商,而是在推动国产AI芯片、开源推理框架和模型服务之间形成更广泛协同。国产算力建设正在从单点硬件替代,进一步走向“模型发布—芯片适配—推理框架优化—云端服务—行业应用”的协同链条。
三、投资建议
受益标的:
国产芯片:寒武纪,海光信息,摩尔线程,沐曦股份;
国产算力产业链:盛科通信,华丰科技,航天电器,杰华特,意华股份,网宿科技,光环新网,优刻得,首都在线,利通电子,神州数码,烽火通信,浪潮信息,华勤技术;
国产大模型:智谱,Minimax。
四、风险提示
核心技术水平升级不及预期的风险,AI伦理风险,政策推进不及预期的风险,中美贸易摩擦升级的风险。