风向彻底变了!英伟达H20彻底崩盘,华为用“超级Token工厂”改写AI算力规则。 英伟达恐怕从未如此狼狈——H20芯片生产线紧急叫停,数十万颗库存积压,三星、台积电、富士康相继断供。而就在一个多月前,黄仁勋还穿着唐装访华,试图稳住中国市场。 转折点发生在今年7月底,网信办和工信部接连出手,直指H20的安全问题和国产化替代。央视旗下“玉渊谭天”更是直接定性:不先进、不安全、不环保。 一夜之间,国内企业纷纷转向华为昇腾。但华为的真正杀招,远不止芯片——而是率先押注“Token时代”,把算力变成新一代能源。 华为用384颗昇腾芯片搭建CloudMatrix超节点,硬刚英伟达NVL72;更推出Tokens服务,按需计费、普惠开放。从“卡时计费”到“Token流水线”,华为彻底重构了AI算力的商业模式。 美国的科技封锁,逼出了华为的“大杂烩式创新”——从光互联、能源管理、散热技术到全栈软件优化,用系统能力弥补单点短板。 自2019年被封锁后,华为被逼造出了昇腾芯片,虽然由于制程问题,昇腾单卡性能大为受限,但经过两年多的卧薪尝胆,华为用384颗昇腾芯片组成了CloudMatrix384超节点,靠光通信实现高速互联,硬是在整体算力上追平了英伟达72颗GPU组成的超节点。 今年以来,DeepSeek点燃了Agent的发展,作为AI时代的“电器”,Agent对tokens的消耗正在指数级上涨,仅是今年6月对比去年初,中国的日均token消耗量就保障了1000倍。而华为的芯片及超节点,为爆发的tokens需求做足了算力基础设施的准备。 今年3月份,面对AI大爆发,华为云还推出了tokens服务,突破了以往按卡时计费的模式。8月27日,又宣布tokens服务全面接入超节点。作为软硬结合的“大杂烩”公司,华为云发挥了自己的软件能力,通过系统架构的不断调整,不断提升算力性能。 通过自研的xDeepServe框架,超节点算力的吞吐量从600 Tokens/s飙升到2400 Tokens/s,时延从100ms压到50ms以下,达到了业界领先的性能。而借助于更为先进的下一代昇腾芯片,华为云Tokens服务的吞吐量将会不断突破,与此同时,时延将不断降低。 Token时代刚刚开始。中国AI,终于把算力主动权握在了自己手中。
风向彻底变了!英伟达H20彻底崩盘,华为用“超级Token工厂”改写AI算力规则
烟火阑珊歌未央
2025-08-27 19:45:46
0
阅读:52