DeepSeek拟人 哇呀啧呜哇美国政府测试Deepseek V4 Pro结果发布!它们认为Deepseek V4 Pro落后美国最先进的大模型不是3-6个月,不是7个月,而是8个月!
¹ 美国商务部,NIST,人工智能标准与创新中心(CAISI),这个机构的任务之一就是追踪、量化评估中国的大模型跟美国大模型的竞争力。
² CAISI评估认为(网页链接),虽然DeepSeek官方自测认为该模型达到GPT-5.4水平,但CAISI使用非公开测试集评估认为,其真实实力更接近GPT-5。GPT-5的发布日期是2025年8月7日,所以认定“落后8个月”。
³ GPT-5.5(约1250分)与 DeepSeek V4 Pro(约800分)存在约450分差距。意思是:处理顶尖复杂任务时,前者的胜算可能比后者高出10倍以上。
⁴ 成本优势确实存在。比能力相近的另一个大模型(GPT-5.4 mini)更具性价比。热点科普
