众力资讯网

最强赛博章鱼保罗,真让百度文心当上了?

世界杯热度起来了,AI圈已经先开了一场世界杯预测世界杯。

由联想集团与咪咕视频联合发起的“世界杯预测人机大战”,召集了12大主流AI模型,与球迷一起逐场预测比分。15场过后,阶段成绩单出来了:百度文心命中7场,胜率46.7%,暂列第一。

单看数据,文心的领先优势还挺明显的。

但真正让我觉得有意思的,而是6月15日科特迪瓦对厄瓜多尔那场🤙。

那场球赛前被认为势均力敌,多数模型倾向于平局,其中7家模型齐刷刷给了1:1。

只有文心,给了1:0,科特迪瓦胜。

最后比分,1:0。

一场爆冷局,文心成了唯一预测对的那一个模型。

说实话,足球这东西太不稳定了,球员状态、伤病、战术、天气、临场发挥,任何一个变量都可能改写结果。

人类球迷预测世界杯,本来就经常被打脸;现在换AI来预测,反而更能看出不同模型处理复杂信息的能力。

这次文心能猜对,确实够有水平,当然了,预测这种事,没办法做到百分百准确。

不过话说回来,百度2000年就开始做搜索了,互联网上跑过的世界杯数据,它大概都见过,这波,属于是资深老球迷的推理。

据了解,这次文心调用的是今年5月发布的文心5.1。在LMArena搜索榜上,这个模型拿过国内第一、全球第四👍🏻。

它的特点是能在几秒内完成对FIFA排名、球队身价、战术体系、伤停动态、历史交锋等多维度信息的整合,甚至赛前几小时的天气变化和教练表态,都能被实时搜到并纳入推理链条。

简单说,它是把各种变量压缩成一条逻辑链,再输出一个带概率的判断。

世界杯预测这件事,本质上是一个多变量、强不确定、持续变化的复杂判断任务。模型能在这种场景里稳定输出,说明它已经在解释“为什么”。

文心5.1这次的表现,某种意义上也是大模型能力的一次“实战验收”,在真实、开放、有公开对照的公共场景中,和同行同台竞技。

比赛还在继续,预测也还在继续。下一轮结果出来,排名可能还会变。但至少到目前,文心在第一阶段的表现,确实让人对AI预测这件事多了一点信心。