众力资讯网

OpenAI首款定制AI芯片官宣,9个月完成流片 新浪数码今天发了条OpenAI

OpenAI首款定制AI芯片官宣,9个月完成流片
新浪数码今天发了条OpenAI发布首款定制AI芯片的消息,信息量挺足:OpenAI联合博通掏出首款定制AI芯片,代号Jalapeño,专门用来跑大模型推理,从设计到流片只花了9个月。分工也很明确:OpenAI负责芯片架构设计,博通接流片和网络硬件的部分,目前工程样片已经完成验证,预计今年底规模化落地,配套的是千兆瓦级数据中心集群。
9个月流片,分工走的是务实路线
一般定制芯片从架构设计到流片回片,正常周期得12到18个月,OpenAI+博通9个月跑完,这项目的优先级拉得有多高可想而知。两边分工也没搞花活:OpenAI自己最清楚自家大模型的推理逻辑、数据调用路径,所以抓最核心的架构设计;博通本来就是高端芯片流片和高速网络硬件的老玩家,之前和谷歌TPU就有过合作经验,流片加配套网络部分交给它,两边都不用从头踩坑,速度才能提上来。
这款芯片的核心优化方向是数据流动效率,目标很直接:提升推理效率、降低能耗,完全贴合推理场景的需求。
专攻推理,先解自家的燃眉之急
不少人看到OpenAI做芯片第一反应是"要对标英伟达",其实这次Jalapeño的定位很清晰:只做大模型推理,不涉及训练端。这也完全是按OpenAI当下的实际需求来的——现在ChatGPT、API服务的推理算力开销占比越来越高,之前基本靠租微软Azure上的英伟达卡供给,不仅成本高,高峰期还常遇到算力卡脖子的问题。
自研推理芯片的好处很明显:针对自家模型的推理场景做定制优化,比如多模态输入、长上下文调用的数据流动路径,OpenAI自己比谁都清楚,调完之后同等算力下的推理效率肯定比通用GPU高,能耗也能压下来,长期摊下来的成本比租卡划算太多。这次配套千兆瓦级数据中心集群落地,说明不是小批量试水,是准备大规模替换现有的推理算力供给。
之前OpenAI传了一年多自研芯片的消息,最早说要做全功能训练卡对标英伟达,后来慢慢缩到先做推理,这次Jalapeño落地,相当于第一步棋走实了。工程样片已经验证完,年底就能规模化上线,如果推理侧跑通了,后续会不会再往训练端延伸,就看接下来的节奏了。对英伟达来说,OpenAI这个大客户开始自研推理芯片,推理侧份额估计要被啃一小块,不过短期影响不大,毕竟Jalapeño目前只供OpenAI自己用,还没对外卖的打算。