众力资讯网

为什么这个“算盘芯片”能干掉GPU?3个关键点告诉你,它不是吹牛

最近科研圈子里的讨论群,消息提示音此起彼伏,不太平静,起因是北京大学那边传出来一件听着不太真实的事,一个叫孙仲的研究员带

最近科研圈子里的讨论群,消息提示音此起彼伏,不太平静,起因是北京大学那边传出来一件听着不太真实的事,一个叫孙仲的研究员带着两拨团队,把一块以往只在论文里构想过的新型芯片,真的做了出来。

它走的路数很不一样,既不是靠替换材料来升级,也不是一味把尺寸做小,而是一个几乎没人敢轻易尝试的方向,模拟计算,这词儿乍一听,确实有点老旧,仿佛是八九十年代电子工厂里才会念叨的术语,带着一股淡淡的机味,

可它背后的技术含量,远比听上去要复杂得多,他们这次做出来的,是一种基于阻变存储器的模拟矩阵计算芯片,它不仅能做高精度的运算,关键是,它的速度和能耗都达到了一个惊人的地步,有人这么描述,它自己干一个大型矩阵求逆的活儿,效率比好几块高性能的GPU绑在一起通宵运算还要高出很多。你没看错这其中的差距,不是强一点半点,而是直接百倍起跳,消息公布没过几天,知乎上一个身在芯片圈子里的人评价说,这已经不是单纯发论文了,而是从最底层的物理器件,到电路结构,再到上层的算法,全部都重新发明了一遍,而这些,正好就是过去几十年里,模拟计算一直被卡住脖子的那几个地方,精度这道坎,说起来真是让人头疼,

要不是这次真的做成了,模拟计算这东西,在工程师们平日闲聊里,恐怕早就成了一个被束之高阁的旧话题,它的思路其实听着很妙,用起起伏伏的电压电流去直接对应数学方程,完全不像数字芯片那样,还得依赖冰冷的1和0去一点点敲算,

听起来行云流水,可麻烦也就藏在这里面,理论上模拟信号能细到没有尽头,但现实中哪有那么干净的环境,

电路里一丝微小的颤动,或是一点点温升带来的扰动,都可能让计算结果偏到天边去,

这就让它始终够不着高精度的门槛,连教科书上都写得明明白白,模拟计算,胜在天然,也败在噪声,

于是圈子里似乎有了默认的规则,精细活都交给数字芯片,模拟计算就老老实实处理那些模糊识别的任务,别去抢跑道,但孙仲的团队偏不这么想,

他们挑了条瞧着最不现实的路,用那种阻变存储器搭成电路阵列,让奔流的数据在原地就完成计算,再配上自己反复琢磨过的电路结构和一套堪用的算法,居然硬是把模拟计算的精度,第一次推到了24位定点这个级别,

后来听一个做通信的朋友提起,这个精度,已经足够去啃MIMO信号检测那样的硬骨头了,

真正让人心里一紧的,是他们直接动手的实验,一个128乘128的矩阵求逆运算摆在面前,就这么个任务,要是换成传统GPU,机房里风扇得呼呼转上好几个小时,而他们那块芯片,几乎没怎么犹豫就跑完了全程,计算吞吐量直接拉开上千倍,能耗的差距还要再乘以一百,

这并非是空口说说,相关的论文就发表在《自然电子学》上,全世界同行都在翻看,

说出这些数据时,他们神色平静,光跑得快还不够,它真正可能动摇的是整个算力中心的根基,模拟计算这个词,以前不是没听过,神经形态芯片,DNA计算,这些概念在圈子里飘了好几年,但能真正走到商用落地的一只手都能数过来,大家心里都有个谱,觉得这多半是用来展示肌肉的,真到了关键时刻,还得靠机架上那些嗡嗡作响的GPU来撑场面,但北京大学团队拿出的这块芯片,就不是一回事了,

它不光是跑得快,更难得的是又精又稳,性质一下子就变了,有位业界的AI工程师在圈内感叹,如果这东西真能像论文里描述的那样,扩展成大规模阵列,那么整个AI训练的链路都要换个思路,过去那些依赖数字GPU进行矩阵运算的大模型,恐怕得重新规划自己的硬件家底,

最关键的还是能效,这一点不能忽略,在精度看齐顶级GPU的同时,它的功耗可能连人家的百分之一都不到,

如果商用级的芯片真能做出来,那往后训练大模型消耗的能量,可能就像机房里震耳的轰鸣,突然安静下来,只剩下几缕微风,付出的代价从几吨电变成几瓶水的样子,

想一想,一个国内的研究团队,就这样不声不响地,把全球芯片体系最顶上那根指挥棒的方向给轻轻拨了一下,这感觉不只是技术发表那么简单,

更像是在行业里每个人的耳边,都响起了一阵若有若无的钟声,提醒着大家模拟计算的时代或许要回来了,不过车别开太快,有些话得先放桌上说清楚,尽管现在到处都是兴奋的声音,屏幕的冷光下,也有人指尖敲着键盘,泼着冷水,

比如,真要让它去跑大模型的训练,阻变存储器这些关键器件能不能稳定地批量生产,就是绕不过去的第一道坎,良率上不去,一切都是空谈,

还有一个很棘手的问题,模拟芯片调试起来很困难,不像数字芯片那样有一套严密的逻辑验证流程,一旦出了故障,就像在黑暗的房间里找一根掉落的针,

更实际一点看,它跑得是快又省电,可很多任务还是离不开数字芯片的配合,它像个初来乍到的新兵,暂时还不能独当一面,

但这件事的分量又没法忽略,

毕竟这是国内科学家第一次,真正在芯片的底层结构上做出了独创性的东西,也打破了那个流传了几十年,认为模拟路线走不通的旧观念,

评论区里有条留言,像句气话,却又有点意思,说美国不让碰EUV,那干脆就自己另起炉灶,造个能甩开它的新体系,这世界有时就是这么怪,一边是喊了四十年的数字霸权,另一边,是实验室灯光下的一套新逻辑,

它从角落里悄悄绕了过去,感觉像是捡回了旧算盘,打开一看里面却是另一片天地,

所以这事得拎清楚,它不是什么国产替代,是换个玩法重新开局,它跟那种传统意义上的国产芯片方案,确实不是一回事,

这不像我们自己造个GPU去追赶别人,而是直接跳出了那个赛道,换了个新门类,这种感觉不好形容,仿佛一桌人都在下围棋,我们这边, вдруг把棋盘上的子换成了跳棋的玩法,

你也没法说它违规,毕竟棋盘还是那个棋盘,只是规则不同了,这种结构层面的新东西,才是真正能扰动固有秩序的力量,

所以现在纠结它能不能马上商用,我觉得意义不大,真正关键的是,它证明了一件事,

芯片的进步,不一定非要变得越来越小,工艺节点也不必非得一路猛冲,有时候换条路走,也能把那扇铁门给砸开,

回想前几年大家还在念叨着5nm和3nm,一门心思都在EUV上,

而这一波,它像是从后门悄悄探出头,然后轻声说,那条路我们不跟了,另起一行,

管这叫世纪难题,其实一点也不夸张,它就像一张被废弃的草稿纸,一个早就被认定走不通的死胡同,现在却不知被谁的手指轻轻一拨,整个局面就活了过来,

后续的行业要怎么入场,资本的流向会如何,旧有的架构又该怎么洗牌,那些都是桌子底下的新故事了,

但有一件事似乎已经尘埃落定,好像有人翻开了那本压在箱底的旧书,特意翻回到属于模拟时代的那一页,还用蘸了墨水的笔,重重签上了自己的名字。