国产服务器完美适配DeepSeek。近日,联想首款AMD AI服务器迎来里程碑式突破,单台联想问天WA7785a G3部署满血版DeepSeek大模型时,极限吞吐量达到了6708 token/s,表明国产服务器再次刷新数据处理速度与效率的上限。 联想问天WA7785a G3服务器是联想与AMD联手打造的成果,在算力引擎、显存容量和架构设计上进行了技术创新。其中,联想问天WA7785a G3内置了一套三重独立风道系统,分别针对CPU节点、GPU节点和交换机节点进行精准散热控制。可以把它想象成给服务器装了一个“智能空调系统”,每个关键部件都有自己的散热通道,避免了因为过热而导致性能下降或宕机的问题,确保服务器在长时间运行时依然保持稳定和可靠。
此外,联想依托联想万全异构智算平台,采用访存优化、显存优化、PCIe 5.0全互联架构创新等一系列技术手段,对大模型从预训练、后训练到推理的整个生命周期进行全方位优化。这些技术创新应用在一起,让联想问天WA7785a G3运行DeepSeek大模型时,实现高达6708 token/s的吞吐量。