众力资讯网

梁文锋迁移代码到昇腾很多人看到DeepSeek开始适配昇腾,觉得不就是换个芯片跑

梁文锋迁移代码到昇腾

很多人看到DeepSeek开始适配昇腾,觉得不就是换个芯片跑模型吗?真不是!

AI训练这套东西,有点像你把一支F1车队从一条赛道搬到另一条赛道。车还是那辆车,但赛道特性、下压力调校、轮胎配方全变了。很多针对英伟达CUDA写的东西,到了另一套架构上未必能直接跑,就算能跑,性能可能掉一大截。

所以最难的从来不是启动成功,而是让模型训练速度、推理效率、稳定性都接近原来的水平。这里面涉及大量底层优化,而且很多活儿特别枯燥,外面几乎看不见。

至于为什么要迁?原因也不复杂。谁都知道英伟达现在最强,但如果一家大模型公司所有能力都绑在一套硬件体系上,风险太大了。今天是成本问题,明天可能是供应问题。

所以迁移昇腾,本质上不是放弃英伟达,而是在给自己准备第二条路。