现场算账,超节点选型看过来!
今年有算力中心采购KPI,智博会特意跑来看国产万卡集群方案。华为和曙光展位紧挨着,顺便拉出来比比。
华为CloudMatrix 384:单组384张昇腾910C NPU,FP16算力约300 TFLOPS,配全液冷,整机功耗559kW。扩到万卡规模需要约27个超节点,432个机柜,占地超800平。
曙光scaleX万卡超集群:一组万卡集群=16个高密机柜(含12计算+4交换),集成上万张AI加速卡。单柜兼容多品牌国产加速卡混插,对供应商体系灵活。整机功耗支持900kW,浸没相变液冷,PUE做到1.04。算力密度比传统提升20倍。
两家报价特点也基本摸到了:
华为万卡集群:全自研硬件+软件栈授权费较高
曙光万卡集群:开发生态、整柜交付,混插架构压低供应商依赖成本
回头看,华为的优势是端到端可控、软硬一体调优深;曙光则凭密度、能效和开放生态性打动务实客户。
如果机房空间不愁、软件生态依赖重,选华为。但多数企业机房是现成的,空间、能效、成本叠加后,曙光方案的整体性价比优势非常明显。
