DeepSeek拟人哇呀啧呜哇美国政府测试Deepseek V4 Pro结果发

DeepSeek拟人哇呀啧呜哇美国政府测试Deepseek V4 Pro结果发布！它们认为Deepseek V4 Pro落后美国最先进的大模型不是3-6个月，不是7个月，而是8个月！

¹ 美国商务部，NIST，人工智能标准与创新中心（CAISI），这个机构的任务之一就是追踪、量化评估中国的大模型跟美国大模型的竞争力。

² CAISI评估认为（网页链接），虽然DeepSeek官方自测认为该模型达到GPT-5.4水平，但CAISI使用非公开测试集评估认为，其真实实力更接近GPT-5。GPT-5的发布日期是2025年8月7日，所以认定“落后8个月”。

³ GPT-5.5（约1250分）与 DeepSeek V4 Pro（约800分）存在约450分差距。意思是：处理顶尖复杂任务时，前者的胜算可能比后者高出10倍以上。

⁴ 成本优势确实存在。比能力相近的另一个大模型（GPT-5.4 mini）更具性价比。热点科普

众力资讯网