众力资讯网

来算算特斯拉AI4和HW3的内存带宽值。马斯克最近的推文表示:AI3(HW3)只

来算算特斯拉AI4和HW3的内存带宽值。

马斯克最近的推文表示:AI3(HW3)只有 AI4 大约 15% 的有效内存带宽。这应该是FSD 实际运行时能真正用上的带宽。

2019 年 Tesla Autonomy Day,特斯拉公开介绍过 HW3 / AI3 的硬件规格:单颗 SoC 是 128-bit LPDDR4,4266Mbps/pin,峰值内存带宽大约 68GB/s。

这个数据在当年已经够用,但到了今天的大模型时代,瓶颈早就不是 TOPS,模型推理过程中的数据搬运能力,变得同样关键。

AI4 的内存带宽,官方没有公开过,但有人拆解后推测单颗芯片大约是 224GB/s,整套 FSD电脑,HW4 双芯片理论合计约 448GB/s。(应该不能线性相加)

但如果按马斯克这次的说法反推,AI3 只有 AI4 大约 15% 的有效内存带宽。用 AI3 单颗 68GB/s 除以 15%,可以反推出 AI4 大约是 453GB/s。这个数字刚好接近 HW4 双芯片拆解推测值 448GB/s。

所以AI3 的两颗Soc可能更多只是校验和冗余的分工,

AI3能跑V14 Lite,显然不只是把模型缩小。他要在非常有限的内存带宽条件下,把V14 的驾驶能力压进 AI3。背后涉及模型蒸馏、压缩,访存优化,还有整条车端推理链路的压榨。

只能说特斯的工程能力确实强。