众力资讯网

HDC2026 华为自己大模型openPangu 2.0 Pro,505B 总参

HDC2026 华为自己大模型openPangu 2.0 Pro,505B 总参数配 18B 激活,28:1 稀疏比。

稀疏比 28:1 在千亿参数档位的 MoE 里算是很激进的了,DeepSeek-V3 差不多 18:1.

之所以要这么高的稀疏比,估计还是因为昇腾。

要知道 910B 的显存带宽只有 1.6 TB/s,H200 是 4.8 TB/s 差了整整3倍,理论上不做双稀疏就根本跑不动 512K 上下文。

端侧同步发了一个 30B/2B,稀疏比没那么激进是15:1 ,但逻辑是一样的,跑在手机 NPU 上也要把专家切换频率降下去,推理时减少权重搬运。

等等看 Mate 90 系列的芯片怎么样。 东莞·东莞银行篮球中心