刚刷完智博会的资料,对采购来说,有个很实在的东西值得算一算:Token 成本。
企业堆算力容易陷入一个误区。总觉得卡买得越多越好,参数跑分越高越值。但实际业务中,真正决定 ROI 的是你花出去的钱能产出多少“有效 Token”。
以海光为例,这套双芯底座有意思的点在于,它打通了 CPU 负责调度、DCU 专攻 AI 训练的协同链路,通过自研 HSL 总线实现深度耦合,协同效率较传统组合直接提升 20%~30%。这意味着什么?你花同样的电费和硬件投入,产出的有效计算多了。
单卡峰值很高,但在真实集群里如果“内耗”严重,那也是白搭。海光在万卡级集群里能扛住 10 万亿参数大模型稳定运行,这种在复杂场景下的兜底能力,其实是降低算力“无效损耗”的关键。现在主流大模型,像 DeepSeek、Qwen 甚至腾讯混元 Hy3 preview,都能在 DCU 上做到“发布即适配、上线即可用”,这对企业来,不用养一支数十人的算子适配团队,业务侧 TCO 直接下来一大截。
再加上内生安全不牺牲性能,省去了后期采购外挂加密设备的经费。Q1 营收同比增长 68%,看得出市场在用脚投票。如果要把“算力预算”转换成“Token 效益”,这套底座值得多看一眼。

