众力资讯网

【算苗3D TokenPU正式流片,以3D混合堆叠突破内存墙】6月17日,算力芯

【算苗3D TokenPU正式流片,以3D混合堆叠突破内存墙】6月17日,算力芯片企业算苗科技宣布,旗下面向大模型推理的3D TokenPU芯片A4E,于6月15日正式流片。
然而,大模型推理长期受制于“内存墙、算力墙、通信墙”三大核心瓶颈,造成高达80%的能耗和70%的成本压力。
算苗科技专注3D架构AI云端大算力芯片研发设计,跳出通用GPU的设计思路,专攻推理场景极致性能,核心客户为头部大模型厂商,目前已联手客户开展近一年的深度研发工作。
第一代产品A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆上,通过硅通孔(TSV)与凸点(bump)技术实现微米级互联,将传统芯片间的“毫米级”传输距离压缩两个数量级,从而带来16TB/s的超大访存带宽。
在架构设计方面,算苗科技引入Tile-Native软硬件协同理念;供应链方面,已构建起覆盖芯片设计、核心IP、制造、封装的国产化供应链体系,A4E芯片基于自研RISC-V架构与自研IP、自研软件体系打造,与国内头部供应链伙伴深度合作。
“我们不是在别人的赛道上追赶,而是在开辟新的方向。”算苗科技创始人兼CEO汪福全博士表示,“3D TokenPU专为大模型Token处理而生,不必单纯依赖制程缩小,就能实现算力密度、能效比的跨越式提升。”(21世纪商业评论)