卡英伟达、微软脖子?电磁屏蔽究竟有何魅力

壹零社科技宅 2024-05-29 07:54:53

电磁屏蔽在PC硬件领域并不算新鲜技术,可为何近日接连被英伟达和微软这样的业界大佬点名呢?

01

扼住英伟达GB200咽喉的“电磁屏蔽”

前不久,Blackwell架构及GB200在英伟达GTC大会首次现身,二级市场迅速爆发“铜缆高速连接热”。相较于光通信,铜缆高速连接具有成本低、功耗低、易于布线和维护等优势,但也存在一个薄弱点——铜缆很容易受到电磁干扰影响。

相较于传统的光通信,铜缆高速连接具有成本低、功耗低、易于布线和维护等优势,但也存在一个薄弱点——铜缆很容易受到电磁干扰影响,基于铜缆高速连接的AI服务器因此有了电磁屏蔽需求。

而在英伟达最新季度财报业绩交流会上,英伟达CEO黄仁勋预计今年Blackwell架构芯片将带来大量收入。据悉,Blackwell架构芯片意向客户包括亚马逊、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉等。

GB200的市场需求与进度远超预期,再次点燃市场对铜缆高速连接将引领AI服务器的热烈期待。

而除英伟达外,微软也于不久前第一款Copilot+PC,也就是自家最新的Surface系列将在6月18日推出,而这款笔记本电脑将搭载高通的Arm架构处理器,包括此前高通发布不久的骁龙X Elite和骁龙X Plus两大重磅自研处理器,采用英特尔和AMD芯片的版本会在更晚的时候发售。

在外界看来,终端 AI硬件为了运行 AI 相关功能需要更强的算力支撑,这不仅对 CPU、GPU、NPU 等芯片提出更高要求,也带动了存储、散热、电磁屏蔽等部分需求提升。AIPC、AI手机成为发展趋势,将会对散热及电磁屏蔽解决方案提出更高的要求。

据BCCResearch预测,2023年全球电磁屏蔽材料市场规模92.5亿美元。市调机构QYResearch预计,2029年全球电磁屏蔽膜市场规模将达2.3亿美元,未来几年年复合增长率为5.3%。

02

铜互联最大预期差

英伟达GB200需求、进度超预期,核心增量在于铜互联,即在rack内部使用高频高速铜线缆进行GPU间的数据互通,以推动大模型训练和推理。服务器内大量使用高速铜线是英伟达推动的机内连接范式变革,当前正处于导入期。

电磁屏蔽材料是指能实现对电磁波屏蔽的功能性材料,其作用原理是通过对电磁波的反射和吸收来达到对电磁波的阻隔或使其衰减的目的。目前,其产业下游涵盖通讯设备、计算机、手机终端、汽车电子、家用电器、国防军工等终端应用领域。

在AI服务器的激烈竞争中,如果不能有效抵抗电磁干扰,将导致产品使用寿命缩短、额外成本增加,甚至影响研发进度和企业竞争力。因此,电磁屏蔽材料在铜互联AI服务器中的应用变得至关重要。

而铜互联相比光通信具有成本低、功耗低、易于布线和维护等优势,但也存在一个较为致命的弱点,就是铜缆很容易受到电磁干扰影响(而光纤几乎不受影响)。以英伟达GB200为代表的AI整机服务器是一套高度复杂的电气系统,但未来却将面临着电磁干扰的威胁。电磁干扰的主要来源正是服务器自身。为了加强训练效率,当前AI服务器整机普遍功耗较大,采用多个高功率电源,DGX H100配有6个3300W高功率电源,GB200预计设计功耗将达到12万瓦,其内部高功率电源必然会产生强力的电磁干扰,而GB200内部的铜线将难以抵抗。

当前各大厂都在紧张进行AI军备竞赛、大模型开发竞赛,AI服务器如果不能很好地抵抗电磁干扰,不但容易缩短使用寿命、造成额外成本,而且会耽误研发进度,影响企业竞争。

因此,铜互联导入AI服务器的浪潮之下,电磁屏蔽材料是核心预期差。过往市场对电磁屏蔽材料的讨论多集中于AIPC对需求的拉动,AI服务器对电磁屏蔽材料的拉动将带来巨大增量,是GB200赛道与铜互联相伴而生的核心预期差

03

铜互连与光模块的纷争

同样应用于AI服务器和数据传输,铜互联的崛起很自然就让人们想到了这些年崛起的光模块,两者之间又有何关联?

这一点我们首先要从数据中心网络架构加速向高速率带宽迭代讲起。大模型及应用对算力基础设施要求较高,需要稳定、高效、安全的数字基础设施来支持其完成生成、存储、传输的整个交互过程,随之带来了对计算能力前所未有的需求。根据中国智能算力产业联盟数据,在 AIGC 的驱动下,对 AI 算力的需求呈指数级增长,大约每 1-2 个月翻一番。

数据中心设备间互联成为制约数据中心整体系统算力提升的瓶颈,通信网络带宽速率提升势在必行。以历代 PCIe 协议为例,2003 年 PCIe1.0 发布,单通道传双向带宽为 500MB/s,传输速率为 2.5 GT/s;目前最新的 PCIe 6.0 规范于 2021年发布,传输速率提高至 64 GT/s,根据 PCI-SIG 发布的技术路线图,2025 年预期将发布的 PCIe 7.0,最大数据速率将达到 128.0 GT/s,通过 16 通道提供高达512GB/s 的双向传输带宽。

而铜连接产品在数据中心高速互联中一直扮演着重要角色,特别是在服务器内部和 Server-Top of Rack 的短距离传输场景下,铜连接对于散热效率和信号传输以及成本方面有着显著的优势。因此铜互连仍是当下以及未来许多应用中最具成本效益的解决方案。

根据 Light Counting,全球无源直连电缆 DAC 和有源电缆 AEC 的市场规模将分别以 25%和 45%的年复合增长率增长,在全球范围内,大型人工智能集群以及长距离的型号传输主要依赖光通信,而较小的数据中心系统仍将主要使用电缆。

光模块技术主要应用于数据中心的高速传输领域,尤其是在需要高数据传输速率和低延迟的场景中,如AI大模型的训练和应用,两者在成本和效率上也有明显差异。

铜互联技术在成本上具有显著优势。例如,英伟达的GB200服务器通过使用铜缆替代光缆,能够实现大幅节约成本,成本节约6倍。这使得铜互联成为短期内降低成本的重要解决方案,而尽管光模块技术在某些情况下可能更昂贵,但它在长期内可以提供更高的带宽和更好的可靠性。例如,随着AI大模型的普及,对算力和网络设备的需求不断增长,这推动了光模块技术的升级和发展。

事实上,中际旭创副总裁、董事会秘书王军在2023年度网上业绩说明会上就铜缆代替光模块说法回应称,铜连接和光连接拥有各自不同的应用场景。铜连接主要应用于芯片间、服务器机柜内以及机柜之间的短距连接,而光模块主要应用于交换机的互连以及柜顶交换机到服务器网卡之间的连接。

光模块可以跟随带宽需求而持续迭代,并有可能会进一步通过硅光等方式渗透至原先铜互连的应用场景,而这也是未来AI数据中心发展的趋势和方向。

0 阅读:79

壹零社科技宅

简介:感谢大家的关注