李飞飞的最新论文，替大家揭穿了一个最大的AI骗局，那就是几乎所有的大模型都会睁眼

李飞飞的最新论文，替大家揭穿了一个最大的AI骗局，那就是几乎所有的大模型都会睁眼说瞎话，而且态度还特别笃定，普通大众根本就无法觉察。结果就是，我们所有人都被AI骗了。为此，她的团队还专门做了一个颠覆认知的硬核实验。

他们选取了当前市面上的17款主流顶级AI大模型，包含大家熟知的各类顶尖多模态模型。实验方法非常简单，但是却直击本质：他们掐断了所有AI的视觉通道，清空了全部的图片像素，只留下一块纯黑的画面，画面里没有任何可视信息。然后开始针对画面，对AI提问。按照正常人的逻辑，看不见任何画面，AI的答题正确率应该无限接近于零。

可让人后背发凉、细思极恐的是，就算面对一片漆黑、没有任何图像信息，这些顶级大模型依旧能从容答题、输出结果。只要你的指令里带上“根据图片分析”这几个字，AI就会立刻开启伪装模式，凭空杜撰所有画面细节。比如说，胸片的病灶位置、图片的纹理细节、图表的走势曲线，它全部能给你瞎编出来，而且语气极度笃定，逻辑严丝合缝，普通人根本分辨不出真假。

可怕的就在这里，它不是看错了画面，是它从头到尾根本就没看见，却熟练地伪装成完全看懂的样子。这就是她论文里定义的：AI视觉海市蜃楼。

为了进一步验证真相，团队又用纯文本模型和这些多模态视觉模型同台PK。结果荒诞到离谱的事情出现了，那些一辈子都没见过任何图片的纯文本模型，得分远超所有号称“超强视觉能力”的多模态大模型，甚至其平均分，都超过了人类专业医生。相当于一个从没见过画面的瞎子，直接拿下了眼科考试的第一名。

为什么会出现这种离谱的结果呢？真相很简单也很残酷。就是市面上，大多数的AI识图考题，根本不需要看图片。那些所谓的AI识图能力，压根不是看懂了画面，只是靠海量的文本记忆、关键词概率匹配在那里蒙答案而已。所谓有强大的AI视觉，真实的视觉增益的模型不足20%，其他的全部是为了蒙资本，吹出来的泡泡而已。

更讽刺的是对照实验，在没有图片、不提前告知AI的前提下，它就自动开启造假模式，正确率出奇的高；但只要明确告诉它没有图片、可以自由猜测时，它的正确率直接断崖式下跌。

不知道大家看懂了没有，AI完美学会了职场老油条的生存套路：永远不说不知道，先甩结论、硬撑气场、编造细节，哪怕全程都是谎言。这才是最害人的。很多公司就是被这种老油条搞死的，但是AI这次要搞的，可不是公司这么简单。

以前我们遇事不决问百度，现在很多人，包括我自己遇事不决，都习惯性地问AI了。但李飞飞给我们描述的AI，比当年百度的广告更害人、更可怕。百度无非是推送的无用广告，我们尚且能够分辨。可AI带着专业、权威、笃定的语气编造谎言，专门收割认知不足的普通人。

我们之所以去问AI，就是因为自己不懂、存在知识盲区。可AI偏偏会用无比自信的假话，把一无所知的我们，一步步带向错误的答案，甚至推向深渊。看得见的错误，我们尚且可以修正；但看不见的谎言，往往会蒙蔽大家的人心。

众力资讯网

李飞飞的最新论文，替大家揭穿了一个最大的AI骗局，那就是几乎所有的大模型都会睁眼

热门分类