【DeepSeek V4 用华为的芯片】DeepSeek V4 与华为等国产芯片的合作,是中国AI产业在算力领域寻求自主可控的一次标志性事件。这不仅是技术层面的适配,更是一次战略性的路线调整,其核心信息可以解读如下:
🤝 合作模式:深度绑定,打破惯例
这次合作并非简单的采购关系,而是DeepSeek与华为、寒武纪进行了长达数月的深度联合研发。
* 重构底层代码:为了确保V4模型能在华为最新的昇腾(Ascend)芯片上流畅运行,DeepSeek团队重写了模型的部分底层代码,并进行了多轮压力测试。* 打破行业惯例:与以往AI公司在发布模型前会优先向英伟达(Nvidia)、AMD等美国芯片厂商提供早期访问权限以进行优化的做法不同,DeepSeek此次将独家合作机会给了华为和寒武纪。这一转变被广泛视为在复杂国际科技竞争背景下,对国产芯片生态的实质性支持,也标志着企业供应链多元化的重要一步。
💪 硬件实力:昇腾950PR芯片的关键优势
DeepSeek V4将主要运行在华为今年3月刚发布的昇腾950PR芯片上,该芯片搭载于Atlas 350加速卡,具备几个关键特性:
1. 强大的算力:其单卡算力号称达到目前对华出口的英伟达H20芯片的2.87倍。2. 创新的FP4低精度推理:这是昇腾950PR最核心的优势。它是中国首款支持FP4格式的AI芯片,能极大压缩模型对显存的需求。例如,一个原本需要140GB显存的700亿参数模型,通过FP4格式仅需35GB即可运行。这意味着在同等硬件条件下,可以部署更大的模型或同时处理更多请求。3. 高功耗的代价:强大的性能也伴随着高能耗,其功耗高达600W,约为英伟达H20的两倍,这对数据中心的散热和供电提出了更高要求。
🚀 战略意义:从“离不开”到“可替代”的关键一步
这次合作对中国AI产业具有深远意义。此前有报道指出,DeepSeek在尝试用华为昇腾芯片训练更早的R2模型时,曾因稳定性、互联速度和软件工具链不成熟等问题而失败,最终仍需依赖英伟达硬件进行训练。
而V4模型的成功适配,说明国产软硬件的协同已经取得了实质性进展。这标志着中国AI行业正从“离不开英伟达”的被动局面,向“至少在推理环节可以用国产方案替代”的自主可控方向迈出了关键一步。如果V4模型的性能如传闻中那般强大,未来开发者将能通过国产算力使用到最前沿的AI模型,从而在很大程度上规避美国芯片出口管制带来的不确定性风险。
