由联想集团与咪咕视频联合发起的“世界杯预测人机大战”,召集了12大主流AI模型,与球迷一起逐场预测比分。15场过后,阶段成绩单出来了:百度文心命中7场,胜率46.7%,暂列第一。
单看数据,文心的领先优势还挺明显的。
但真正让我觉得有意思的,而是6月15日科特迪瓦对厄瓜多尔那场🤙。
那场球赛前被认为势均力敌,多数模型倾向于平局,其中7家模型齐刷刷给了1:1。
只有文心,给了1:0,科特迪瓦胜。
最后比分,1:0。
一场爆冷局,文心成了唯一预测对的那一个模型。
说实话,足球这东西太不稳定了,球员状态、伤病、战术、天气、临场发挥,任何一个变量都可能改写结果。
人类球迷预测世界杯,本来就经常被打脸;现在换AI来预测,反而更能看出不同模型处理复杂信息的能力。
这次文心能猜对,确实够有水平,当然了,预测这种事,没办法做到百分百准确。
不过话说回来,百度2000年就开始做搜索了,互联网上跑过的世界杯数据,它大概都见过,这波,属于是资深老球迷的推理。
据了解,这次文心调用的是今年5月发布的文心5.1。在LMArena搜索榜上,这个模型拿过国内第一、全球第四👍🏻。
它的特点是能在几秒内完成对FIFA排名、球队身价、战术体系、伤停动态、历史交锋等多维度信息的整合,甚至赛前几小时的天气变化和教练表态,都能被实时搜到并纳入推理链条。
简单说,它是把各种变量压缩成一条逻辑链,再输出一个带概率的判断。
世界杯预测这件事,本质上是一个多变量、强不确定、持续变化的复杂判断任务。模型能在这种场景里稳定输出,说明它已经在解释“为什么”。
文心5.1这次的表现,某种意义上也是大模型能力的一次“实战验收”,在真实、开放、有公开对照的公共场景中,和同行同台竞技。
比赛还在继续,预测也还在继续。下一轮结果出来,排名可能还会变。但至少到目前,文心在第一阶段的表现,确实让人对AI预测这件事多了一点信心。



