华为基于自研芯片,打造10万卡集群的算力

玩数据还有点懒 2024-06-13 08:54:18

算力是人工智能发展的三要素之一,目前全球的算力供给龙头是英伟达,在GPU领域几乎一家独大。国内企业也在奋起追赶,其中最有王者之相的还是华为昇腾,已经得到了众多国内企业和各地政府的支持,因为供应链安全已经成为中国人工智能产业发展不可忽视的因素。

AI算力国产化现状

AI算力国产化的核心在于高端AI芯片的国产化。高端AI芯片是支撑AI应用的重要基石,其性能直接决定了AI系统的整体算力。

据IDC预测,到2025年,我国AI芯片市场规模将达到1780亿元,这五年的复合年增长率(CAGR)预计将达到42.9%,比全球市场的32.1%要高。

AI 分布式计算的市场主要由算力芯片 (55-75%)、内存 (10-20%) 和互联设备(10-20%)三部分组成。美国已限制对华销售最先进、使用最广泛 的AI训练GPU—英伟达 A100以及H100,国产算力芯片距离英伟达最新产品存在较大差距,但对信息颗粒度要求较低的推理运算能实现部分替代。

尽管面临着种种挑战,但中国的AI芯片发展依然呈现出曙光。以华为为例,其昇腾系列AI芯片在国内市场已经取得了一定的成功,尤其是在手机、服务器等领域的应用逐渐扩展。华为的努力使得中国在AI芯片领域逐渐站稳了脚跟,同时也为国内其他AI芯片企业树立了榜样。

在美国制裁中国科技发展,限制半导体技术输入中国的背景下,我国也是全力扶持国产AI芯片产业,近日,据说,工信部要求中国移动、电信等需要购买英伟达H20的时候需要进行报备,这要求已经非常明确了,那就是要求使用国产AI芯片,支持国产AI芯片厂商。对于国产AI芯片厂商来说,这可谓是飞来的“泼天财富”了。

国产算力芯片进入量产可用时代

在算力自主可控领域,华为凭借其在国内AI芯片技术方面的显著优势,无疑成为了这一领域的领军者。

目前,虽然国产AI芯片在单卡性能、生态和集群效率上与海外产品仍有一定差距,但改进速度较快,已经形成万卡集群,并在科大讯飞、部分互联网大厂用于 AI 大模型训练。

2023年10月 24 日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。今年1月 30 日,讯飞星火步履不停,基于“飞星一号”,启动了对标 GPT4 的更大参数规模的大模型训练。

“飞星一号“是科大讯飞和华为联合发布基于昇腾生态的国内首个可以训练万亿浮点参数大模型的大规模算力平台,也是国内首个已经投产使用的全国产大模型训练集群,采用昇腾 AI 硬件训练服务器和大容量交换机构建参数面无损 ROCE 组网,配置高空间的全闪和混闪并行文件系统,可支撑万亿参数大模型高速训练。

华为算力包括昇腾和鲲鹏两大系列的芯片、服务器、软件和服务,覆盖了端、边、云的全场景应用。其中,华为昇腾是国产AI芯片龙头,2022年昇腾占据国内智算中心约79%的市场份额。

华为主打 AI 芯片产品有 310和910B。310 偏推理,当前主打产品为 910B,拥有FP32 和 FP16 两种精度算力,可以满足大模型训练需求。910B 单卡和单台服务器性能对标A800/A100。

昇腾计算产业是基于昇腾 AI 芯片和基础软件构建的全栈 AI 计算基础设施、行业应用及服务,能为客户提供 AI全家桶服务。主要包括昇腾AI芯片、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链。

从产业链来看,AI算力产业链上游为算力基础硬件设施,主要包括元器件、ICT基础设施、其他硬件设备等。中游为算力网络与平台,与上游硬件设备及基础设施共同组成数据中心、算力网络等,提供IDC服务、云计算服务,以及各类算力网络服务等。产业链下游则为应用场景与用户。

免责声明:

1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证,并在此声明不承担信息可能产生的任何责任、任何后果。

2、 本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。

3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。

0 阅读:1

玩数据还有点懒

简介:感谢大家的关注