众力资讯网

中科曙光发布会有感!先说个常识:AI训练用的是GPU低精度,但世界运行的基础——

中科曙光发布会有感!先说个常识:AI训练用的是GPU低精度,但世界运行的基础——桥梁设计、飞机气动、气候模拟、药物筛选——全部依赖CPU的双精度计算。没有强大的通用计算平台,工业软件就是空中楼阁。
中科曙光这次干了一件什么事?他们把“算、存、传、用”全链路自研打通了。最核心的是精度突破:128核CPU,512线程,双精度浮点算力首次做到10TFLOPS,国产通用CPU第一次迈进两位数区间。16个内存通道比英特尔和AMD多出1/3,STREAM访存带宽直接超了国际旗舰。这不是单个零件的追赶,而是整套高精度算力底座的系统性替换。
特别想提一下他们的基础软件库HPC-Kit。很多国产硬件跑不快,不是因为芯片差,是因为底层数学库没优化好。曙光从底层BLAS、LAPACK到上层应用全部做了调优,把每一颗核心的性能压榨到极致。这就是为什么他们的应用性能能到上一代的1.8倍。
还有一点让我很触动。他们强调“0迁移成本”。以前在英特尔平台上跑的代码、脚本、容器镜像,拿过来直接跑,甚至性能更好。
有人说,这是国产通用计算平台的“量产拐点”。我觉得,这更像是一个信号,中国的高端科学与工程计算,正在从能用走向好用、敢用。