中科曙光发布会有感！先说个常识：AI训练用的是GPU低精度，但世界运行的基础——

中科曙光发布会有感！先说个常识：AI训练用的是GPU低精度，但世界运行的基础——桥梁设计、飞机气动、气候模拟、药物筛选——全部依赖CPU的双精度计算。没有强大的通用计算平台，工业软件就是空中楼阁。
中科曙光这次干了一件什么事？他们把“算、存、传、用”全链路自研打通了。最核心的是精度突破：128核CPU，512线程，双精度浮点算力首次做到10TFLOPS，国产通用CPU第一次迈进两位数区间。16个内存通道比英特尔和AMD多出1/3，STREAM访存带宽直接超了国际旗舰。这不是单个零件的追赶，而是整套高精度算力底座的系统性替换。
特别想提一下他们的基础软件库HPC-Kit。很多国产硬件跑不快，不是因为芯片差，是因为底层数学库没优化好。曙光从底层BLAS、LAPACK到上层应用全部做了调优，把每一颗核心的性能压榨到极致。这就是为什么他们的应用性能能到上一代的1.8倍。
还有一点让我很触动。他们强调“0迁移成本”。以前在英特尔平台上跑的代码、脚本、容器镜像，拿过来直接跑，甚至性能更好。
有人说，这是国产通用计算平台的“量产拐点”。我觉得，这更像是一个信号，中国的高端科学与工程计算，正在从能用走向好用、敢用。

众力资讯网

中科曙光发布会有感！先说个常识：AI训练用的是GPU低精度，但世界运行的基础——

热门分类