太便宜,5090+deepseek训练碾压H100
本月英伟达将在弯弯发布5090,一张卡3.4P fp8,这个算力非常恐怖,gddr7 32GB 直接碾压hbm2e,一张卡顶一台国产高端AI服务器...
deepseek 训练是用fp8的这种训练方式是低成本的,deepseek 主要是fp8混合训练,5090+deepseek 碾压910C,太尴尬了
fp8的训练模式让deepseek最后真的走成了,a100 h100算力中心市场肯定蹦了,投入建设的h100和a100算力中心,基本上确定要崩盘,最新一代的B架构碾压H架构啊,A架构死在沙滩上...
Blackwell GPU的架构能力太牛了,超越世界上最快的超级计算机的能力...之前的算力中心都鼓吹fp16,现在好了,人家都用fp8和fp4来训练,千亿和万亿大模型了...