2026年4月13日消息,据《新闻晨报》报道,近日,上海棣山科技有限公司(以下简称“棣山科技”)对外披露其2nm高端AI GPU芯片最新研发进展。据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。报道还表示,据行业专业人士分析,该芯片距离正式流片、量产及规模化商用,预计仍需1至2年时间。

△参考图
作为国内专注于高端芯片研发的科技企业,棣山科技自成立以来,始终以“传感器芯片+高算力芯片”双轮驱动为核心战略,重点布局AI GPU领域核心技术攻坚。2025年,公司官方正式对外宣布,首款自研2nm AI GPU原型芯片顺利完成设计第三阶段,这一里程碑式成果,标志着其在高端AI芯片设计领域实现了突破性进展,跻身国内乃至国际先进行列。
据悉,该款2nm AI GPU原型芯片采用FinFET/GAA混合制程与Chiplet异构集成架构,搭载公司自主研发的“棣山智核(DS- Core)”,核心晶体管数量达1700亿颗,芯片面积约800mm²,采用2.5D CoWoS-L先进封装技术,实现高密度互连与高效散热的双重优化,契合当前先进封装成为“新摩尔定律”载体的行业趋势。
经多轮严谨仿真测试验证,该芯片算力表现突出,其中FP32单精度算力可达50 TFLOPS,FP16半精度算力达100 TFLOPS,FP4低精度算力高达400 TFLOPS,可灵活适配不同精度需求的人工智能大模型训练、推理等高端算力场景;能效比较上一代产品提升40%,典型功耗控制在350W以内,每瓦算力可达142 GFLOPS,实现性能与能效的平衡。
同时,研发团队成功攻克高带宽内存(HBM)封装互联、超低延迟片间通信(<0.25ns/mm)、微流道高效热管理三大核心技术瓶颈,其中搭载的HBM4内存单颗容量达48GB,引脚速率超11Gb/s,内存带宽可达3.2TB/s,相较上一代HBM3E带宽提升约2.5倍,可满足大模型训练时海量数据的高速传输需求;微流道热管理技术可使芯片热失控风险降低68%,芯片工作温度稳定控制在85℃以下,为后续芯片长期稳定运行提供了坚实的技术保障。
此外,该芯片支持NVLink 6兼容互连协议,单链路带宽达1.6TB/s,多芯片互联时可实现无瓶颈协同运算,进一步提升整体算力规模,同时兼容主流CUDA软件生态,可大幅降低下游客户技术迁移成本。
截至2026年4月13日,棣山科技这款自主研发的2nm高端AI GPU芯片尚未进入正式流片阶段,仍未完成从设计方案到实体芯片的关键跨越。在2026年举办的日本国际半导体设备及材料展览会等国内外核心半导体行业展会上,棣山科技对外公开了该款芯片的完整设计方案、核心技术参数及多轮仿真测试数据,重点展示了其在2nm制程适配、Chiplet异构集成、自研智核架构等方面的核心技术突破,让行业各界及市场主体直观了解到该芯片的设计实力与发展潜力,披露具体的流片启动时间节点。当前,棣山科技的研发工作已全面聚焦于原型验证阶段的各项核心攻坚任务,重点围绕四大关键领域有序推进:
一是芯片系统级验证,通过搭建全场景仿真测试环境,全面检测芯片在不同算力负载、不同应用场景下的运行稳定性、兼容性及性能表现,及时排查并解决设计层面的潜在漏洞;
二是时序收敛优化,针对2nm先进制程下芯片信号传输延迟、时序偏差等行业共性难点,组建专项研发小组开展集中攻关,通过优化电路设计、调整布局布线等方式,确保芯片各模块时序同步,满足高端AI算力的高效传输需求;
三是量产良率提前优化,结合2nm制程的工艺特性,提前开展良率模拟分析,针对可能影响量产良率的关键环节进行优化设计,有效降低后续流片及量产过程中的良率风险,合理控制研发及生产成本;
四是软件生态同步适配,同步推进配套软件的研发与适配工作,确保芯片硬件与软件系统的高效协同,为后续芯片流片成功后快速开展场景测试、客户导入工作奠定坚实基础。
目前,研发团队正全力以赴推进各项攻坚任务,细化验证流程、优化技术方案,稳步推动原型验证阶段各项工作落地见效,为后续正式启动流片测试、加快量产进程筑牢技术根基。
值得关注的是,受先进制程代工、EDA工具适配、量产良率爬坡等行业共性挑战影响,棣山科技此前规划的“2025年底完成流片前验证、2026年Q1实现量产”的目标有所延后。业内人士分析指出,高端AI芯片从原型验证到流片测试、量产良率提升,再到客户导入及规模化商用,是一个技术密集、流程复杂且周期漫长的系统工程,1-2年的推进周期符合行业常态。结合当前研发进度,预计该款2nm AI GPU芯片有望在2028年底至2029年逐步进入商用阶段。
为加速补齐高端AI GPU领域的技术与生态短板,有效破解先进制程适配、软件生态不完善等发展瓶颈,棣山科技立足自身研发优势,积极搭建国际合作桥梁,全方位推进生态布局,为2nm AI GPU芯片的后续量产与商用筑牢基础。2025年10月13日,棣山科技正式与德国知名半导体企业AragF公司达成深度战略合作,双方共同出资共建AI GPU联合实验室,重点聚焦三大核心研发方向——2nm GPU芯片的通信效率优化、国产化软硬件适配、AI推理加速套件研发。
依托AragF在芯片通信技术领域的深厚技术积累,结合棣山科技在高端算力芯片设计方面的核心优势,双方实现技术互补、协同攻关,计划于2026年底推出AI推理加速套件原型,为后续芯片的场景化应用提供重要技术支撑。
与此同时,棣山科技深刻认识到,软件生态是高端AI GPU芯片落地商用的关键支撑,正集中核心研发力量,全力开发适配自身2nm AI GPU芯片的CUDA兼容编译器、AI框架适配层及全套配套工具链,重点解决现有主流AI框架与国产芯片的兼容性难题,大幅降低下游客户的技术迁移成本,显著提升产品的市场适配性。
目前,公司已与国内多家头部云厂商、自动驾驶核心企业达成预合作意向,围绕云端算力部署、车载AI算力支撑等核心场景开展联合测试,提前布局客户导入与场景适配工作,为芯片后续规模化商用做好充分准备,助力国产高端AI GPU芯片快速融入市场、实现产业化落地。
从全球高端AI GPU行业竞争格局来看,棣山科技在2nm AI GPU芯片设计领域的技术实力已成功跻身国际前沿梯队,实现了与国际主流水平的精准对标。
具体而言,其自主研发的2nm AI GPU原型芯片,经多轮严谨仿真测试验证,FP32单精度算力可达50 TFLOPS,这一核心性能指标已能够与国际芯片巨头NVIDIA旗下的H100、H200系列高端AI GPU芯片同台较量,有效打破了国际巨头在高端AI算力芯片设计领域的技术垄断壁垒,彰显了我国国产芯片企业在先进制程芯片研发领域的突破性进展与强劲发展潜力。但客观而言,高端AI GPU产业的竞争不仅是核心设计技术的比拼,更是量产能力、生态建设、产品可靠性等全链条的综合较量,目前棣山科技与国际巨头之间仍存在明显的阶段性差距。
从产品进度来看,NVIDIA等国际巨头的H100、H200系列芯片已实现大规模量产,广泛应用于云端算力、人工智能大模型训练、高端服务器等核心场景,形成了成熟的产能布局与全面的市场覆盖;而棣山科技的2nm AI GPU芯片目前仍处于原型验证、待流片的关键阶段,尚未进入实际量产环节,距离形成规模化产能还有较长的发展路径。从生态建设来看,国际巨头经过多年深耕布局,已构建起完善的软件生态体系,拥有成熟的编译器、AI框架适配层及各类配套工具,下游客户迁移成本低、适配性强;而棣山科技的软件生态仍处于建设初期,尽管已在全力推进CUDA兼容编译器等配套工具的研发,但尚未形成成熟的生态闭环,这也成为制约其芯片后续商用落地的重要因素。
此外,在产品可靠性方面,国际巨头的高端AI GPU芯片经过长期市场验证,在稳定性、兼容性、使用寿命等方面已形成成熟优势;而棣山科技的2nm AI GPU芯片仍处于仿真与验证阶段,尚未经过实际应用场景的长期测试,产品可靠性仍需进一步验证与优化。
基于此,棣山科技后续仍需持续加大研发投入,聚焦原型验证、流片测试、量产良率优化等核心环节,同时加快软件生态建设与专业人才队伍培育,不断补齐自身发展短板,逐步缩小与国际巨头的差距,推动国产高端AI GPU芯片实现从设计领先到全链条领先的跨越式发展。
棣山科技相关负责人在接受本报采访时表示,公司将始终坚守自主研发初心,以攻克高端AI芯片“卡脖子”技术为核心使命,持续加大研发投入力度,聚焦2nm AI GPU芯片原型验证、流片测试及量产环节的各类核心难题,全力以赴突破先进制程适配、良率优化等关键技术瓶颈。同时,公司将进一步深化国际技术合作,不断拓宽合作边界,同步加快自身软件生态建设步伐,持续完善CUDA兼容编译器、AI框架适配层等配套工具链,稳步推进芯片商用进程。未来,公司将积极对接市场需求、深化与下游客户的合作,力争以优质的国产高端AI GPU产品,为国内高端AI芯片产业高质量发展注入新动能,助力我国在全球AI算力领域持续提升核心竞争力,推动国产芯片产业实现高质量发展。
来源:新闻晨报
芯智讯注:对于这则2nm AI GPU的新闻,我们持怀疑态度。在美国出口管制限制及国内先进制程发展受限的背景下,且不说GAA相关的EDA软件早就对华禁止出口,就算这款2nm芯片设计出来了,能找哪家晶圆厂代工?所需集成的HBM4从哪里去获取?即使按照新闻稿说的,这款2nm AI GPU芯片会在2028年底至2029年逐步进入商用阶段,也就是3年后,届时国内能否实现2nm芯片制造,能否实现HBM4的自主供应,这都是一个问号。现在这么早就来宣传这些,确实有些无语!