众力资讯网

李飞飞的最新论文,替大家揭穿了一个最大的AI骗局,那就是几乎所有的大模型都会睁眼

李飞飞的最新论文,替大家揭穿了一个最大的AI骗局,那就是几乎所有的大模型都会睁眼说瞎话,而且态度还特别笃定,普通大众根本就无法觉察。结果就是,我们所有人都被AI骗了。为此,她的团队还专门做了一个颠覆认知的硬核实验。

他们选取了当前市面上的17款主流顶级AI大模型,包含大家熟知的各类顶尖多模态模型。实验方法非常简单,但是却直击本质:他们掐断了所有AI的视觉通道,清空了全部的图片像素,只留下一块纯黑的画面,画面里没有任何可视信息。然后开始针对画面,对AI提问。按照正常人的逻辑,看不见任何画面,AI的答题正确率应该无限接近于零。

可让人后背发凉、细思极恐的是,就算面对一片漆黑、没有任何图像信息,这些顶级大模型依旧能从容答题、输出结果。只要你的指令里带上“根据图片分析”这几个字,AI就会立刻开启伪装模式,凭空杜撰所有画面细节。比如说,胸片的病灶位置、图片的纹理细节、图表的走势曲线,它全部能给你瞎编出来,而且语气极度笃定,逻辑严丝合缝,普通人根本分辨不出真假。

可怕的就在这里,它不是看错了画面,是它从头到尾根本就没看见,却熟练地伪装成完全看懂的样子。这就是她论文里定义的:AI视觉海市蜃楼。

为了进一步验证真相,团队又用纯文本模型和这些多模态视觉模型同台PK。结果荒诞到离谱的事情出现了,那些一辈子都没见过任何图片的纯文本模型,得分远超所有号称“超强视觉能力”的多模态大模型,甚至其平均分,都超过了人类专业医生。相当于一个从没见过画面的瞎子,直接拿下了眼科考试的第一名。

为什么会出现这种离谱的结果呢?真相很简单也很残酷。就是市面上,大多数的AI识图考题,根本不需要看图片。那些所谓的AI识图能力,压根不是看懂了画面,只是靠海量的文本记忆、关键词概率匹配在那里蒙答案而已。所谓有强大的AI视觉,真实的视觉增益的模型不足20%,其他的全部是为了蒙资本,吹出来的泡泡而已。

更讽刺的是对照实验,在没有图片、不提前告知AI的前提下,它就自动开启造假模式,正确率出奇的高;但只要明确告诉它没有图片、可以自由猜测时,它的正确率直接断崖式下跌。

不知道大家看懂了没有,AI完美学会了职场老油条的生存套路:永远不说不知道,先甩结论、硬撑气场、编造细节,哪怕全程都是谎言。这才是最害人的。很多公司就是被这种老油条搞死的,但是AI这次要搞的,可不是公司这么简单。

以前我们遇事不决问百度,现在很多人,包括我自己遇事不决,都习惯性地问AI了。但李飞飞给我们描述的AI,比当年百度的广告更害人、更可怕。百度无非是推送的无用广告,我们尚且能够分辨。可AI带着专业、权威、笃定的语气编造谎言,专门收割认知不足的普通人。

我们之所以去问AI,就是因为自己不懂、存在知识盲区。可AI偏偏会用无比自信的假话,把一无所知的我们,一步步带向错误的答案,甚至推向深渊。看得见的错误,我们尚且可以修正;但看不见的谎言,往往会蒙蔽大家的人心。