【华西证券-计算机行业周报：DeepSeek~V4强化国产算力适配】研究报告内容

【华西证券-计算机行业周报：DeepSeek~V4强化国产算力适配】研究报告内容摘要　　本周观点:

　　一、DeepSeek-V4上线并开源，百万上下文与Agent能力升级推升推理算力需求

　　本周AI产业链值得关注的变化，在于DeepSeek-V4发布进一步强化了长上下文、Agent和复杂推理方向。4月24日，DeepSeek-V4预览版本正式上线并同步开源，模型上下文处理长度由128K扩展至1M，支持百万字超长上下文，同时输出长度最大为384K tokens；本次DeepSeek-V4首次增加KVCache滑窗和压缩算法，以减少Attention计算和访存开销，并通过模型架构创新更好支持Agent和Coding场景。

　　我们认为，DeepSeek-V4的发布说明国内开源大模型仍在快速迭代，且模型竞争重点正在从通用对话能力，进一步转向长上下文处理、代码生成、工具调用和多步骤任务执行。随着办公Agent、代码Agent、企业知识库和具身Agent等场景扩张，推理侧Token消耗、调用次数和并发压力有望持续提升。

　　二、昇腾超节点全面支持DeepSeek-V4，国产算力从模型适配走向规模化推理验证

　　DeepSeek-V4发布后，华为昇腾超节点的同步适配成为本周国产算力主线。华为官微发文称，昇腾一直同步支持DeepSeek系列模型，本次通过双方芯模技术紧密协同，实现昇腾超节点全系列产品支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销，并结合多种量化算法，实现高吞吐、低时延的DeepSeek V4模型推理部署；昇腾A3超节点系列产品也全面适配，并提供基于昇腾A3超节点的训练参考实现。

　　我们认为，这说明国产算力适配已经从“模型能否运行”，进入“长上下文、低时延、高吞吐、可微调”的工程化验证阶段。对DeepSeek-V4这类长上下文和Agent模型而言，推理系统面临的压力不只是单卡算力，还包括显存容量、KVCache管理、跨卡通信、请求调度和长序列Attention开销。昇腾超节点通过高速互联、统一调度和软硬件协同，有望提升复杂模型在企业级和云端推理场景中的可部署性。

　　另外，寒武纪、摩尔线程及FlagOS同步适配，国产AI芯片生态协同继续加快。除华为昇腾外，寒武纪、摩尔线程等国产AI芯片生态也在本周同步适配DeepSeek-V4。寒武纪已基于vLLM推理框架完成对285BDeepSeek-V4-Flash和1.6TDeepSeek-V4-Pro的Day 0适配，适配代码已开源到GitHub社区；摩尔线程携手智源FlagOS，为旗舰级AI训推一体全功能GPUMTTS5000完成DeepSeek-V4-Flash模型Day-0适配。FlagOS方面，众智FlagOS已完成DeepSeek-V4-Flash在8款以上AI芯片上的全量适配与推理部署，并正在推进DeepSeek-V4-Pro在多个芯片上的迁移适配。

　　我们认为，DeepSeek-V4并非只带动单一硬件厂商，而是在推动国产AI芯片、开源推理框架和模型服务之间形成更广泛协同。国产算力建设正在从单点硬件替代，进一步走向“模型发布—芯片适配—推理框架优化—云端服务—行业应用”的协同链条。

　　三、投资建议

　　受益标的：

　　国产芯片：寒武纪，海光信息，摩尔线程，沐曦股份；

　　国产算力产业链：盛科通信，华丰科技，航天电器，杰华特，意华股份，网宿科技，光环新网，优刻得，首都在线，利通电子，神州数码，烽火通信，浪潮信息，华勤技术；

　　国产大模型：智谱，Minimax。

　　四、风险提示

　　核心技术水平升级不及预期的风险，AI伦理风险，政策推进不及预期的风险，中美贸易摩擦升级的风险。

众力资讯网

【华西证券-计算机行业周报：DeepSeek~V4强化国产算力适配】研究报告内容

热门分类