谷歌花6000万美金买来的“毒蘑菇”让AI产生了幻觉

金长春 2024-06-05 04:33:37

来源: 财经光年公众号

美国财政部长耶伦访问中国期间,曾经点了几盘名为“见手青”的毒蘑菇,挑事的美国媒体认为毒蘑菇让耶伦在访华期间产生了幻觉,出卖了美国的利益。回到美国后,耶伦否认了这种说法,认为烹饪到位的毒蘑菇“非常美味”,自己身体没有任何不适。而谷歌花了6000万美元收购的AI训练语料,却由于“烹饪”方法不到位,让食用语料的谷歌AI中毒,真的产生了幻觉。

最近,谷歌发现旗下的AI Overview状况频出,不仅提出了“披萨配胶水”的黑暗料理,还“建议”用户吃石头补充矿物质和维生素、喝尿治疗肾结石、被响尾蛇咬了用冰块冷敷伤口、感到抑郁可以跳金门大桥等,甚至提出“毒药对人体很好”的离谱结论。

收到大量的用户反馈后,谷歌禁用了某些搜索的AI Overview功能,并对其进行修复和优化。

AI Overview大翻车

和此前Bard一样,AI Overview也是对手们兵临城下时,谷歌仓促应战的产物。

5月中旬,因OpenAI前日发布的王炸级产品GPT-4o拔高了观众的阈值,两小时的谷歌I/O开发者大会即使带来12款新品及升级,还是让观众感到索然无味。

AI Overview正是此次发布会推出的搜索升级功能,该功能将AI结果加入到搜索结果呈现。正式发布前,AI Overview已经过一年时间的测试,期间处理了超过10亿次查询。尽管谷歌为将AI集成进搜索做了精心设计,但体验过后,AI Overview差异性有限,产品性能更是一言难尽。

作为危机公关的一部分,谷歌官方不得不下场回应称,离谱的回答仅在十分罕见的提问中出现的,不代表大多数人的经历。

事实上,诸如“我每天应该吃多少石头?”之类的问题的确属于引导性提问。然而谷歌在面对这类陷阱式的提问时,不仅没能甄别其中的逻辑漏洞,反而有理有据地给出了有害的答案——“加州大学伯克利分校的地质学家表示建议每天至少吃一块小石头,因为石头中含有的矿物质和维生素有益消化系统健康。”倘或一些不明真相的网友选择信任权威,开始每天食用石头,后果将不堪设想。

对于这种一本正经地胡说八道,谷歌CEO劈柴哥(Sundar Pichai)回复称,上述回答产生的根本原因是生成式AI的固有缺陷——幻觉问题,而这个问题目前尚无解决方案。

本质上,幻觉是由于训练数据有缺陷、算法错误或对上下文的误解造成的。

资深人工智能专家郭涛向财经光年表示,幻觉问题虽无法根治,但可以通过技术降低其出现的频率:

一是增加数据多样性,通过收集更多样化的训练数据,提高AI模型的泛化能力,减少对特定数据集的依赖;

二是改进模型架构,使用更复杂的神经网络结构、增加模型的深度或宽度等,提高模型的性能和泛化能力;

三是引入对抗性训练,向模型输入故意制造的错误样本,提高模型的鲁棒性,使其能更好地处理异常输入。

成也贴吧 败也贴吧

HITCon安全会议上的相关研究成果显示,只需“污染”不到0.7%的数据集,就能绕开防御机制,大幅降低大模型输出内容的准确性。当大模型被投喂的数据集含有误导性信息时,其给出的结果必然同样失真。这正是谷歌在这次翻车中的失职之处,不加筛选地给大模型投喂了“有毒”的语料。

例如“如何不让芝士从披萨上面滑落”的问题,AI Overview的回答是,“给酱汁中加入八分之一的无毒胶水,可以使其更粘稠,有助于芝士粘附”。这一答案随后被扒出来自Reddit 一则11年前的恶搞帖子;而在建议抑郁的网友“跳下金门大桥”的回答中则明晃晃地标注着“一位Reddit 用户建议”。

今年2月,谷歌与Reddit达成合作,将其平台上的内容用于训练谷歌的AI模型。Reddit上线于2005年,是美国流量排名前十的社区论坛,又称为“美版贴吧”。公司于今年3月正式上市,2023年亏损近1亿美元,仍处于商业变现的早期阶段。

大模型热潮让Reddit实实在在体验了一把泼天富贵:一方面,Reddit得以将UGC内容授权用于模型训练,仅和谷歌的授权协议每年就价值6000万美元,最近还敲定了和OpenAI的合作;另一方面,谷歌AI搜索的算法更新让Reddit网站流量激增126%,今年一季度收入同比增长了48%。

作为百度贴吧中一个子版块,弱智吧最近也在国内的大模型训练中发挥了重要作用。一项来自中科院、滑铁卢大学等高校和机构的研究显示,使用弱智吧数据训练的大模型,在问答、头脑风暴、分类、生成、总结、提取等8项测试中取得最高分。跑分超过百科、知乎、豆瓣、小红书等平台,甚至是研究团队精心挑选的数据集,直接登顶大模型最好的中文语料库。

不得不说,大模型为贴吧这一PC时代的产物打开了变现的新思路。不过,谷歌每年花费6000万美元买来的语料库,最终训练出的成果竟如此上不得台面。

深度科技研究院院长张孝荣认为,弱智吧数据质量相对较高是个特例。在使用贴吧内容进行大模型训练时,有以下注意点:

需要对原始语料进行清洗和处理,以去除水贴、广告、谩骂等不良内容;

需要对语料进行标注和分类,以便更好地训练模型;

此外,还需要注意模型的泛化性和可解释性,通过一定的策略扩充训练数据集,以确保模型在不同场景下的表现和适用性。

AI搜索是好生意吗?

当下,AI搜索是海内外AI创业团队的重要方向之一。

去年2月,微软上线了GPT-4加持的New bing。截至今年1月,其市占率已从2023年的2.97%增长至3.42%。微软还在New bing的一些回答中插入广告来实现创收,今年一季度,微软的搜索与广告营收增长12%,超出预期,AI贡献明显。

Similarweb数据显示,主打AI搜索的创业公司Perplexity今年前三月的流量持续增长,分别为4560万、4954万和6149万,最新估值已超过25亿美元。

眼看市场份额不断被侵蚀,谷歌又慌了。

今年3月,谷歌任命进入公司20年的老将Liz Reid担任生成式搜索业务的负责人,还将前搜索质量和排名主管Pandu Nayak任命为谷歌搜索首席科学家。这次重大的高管洗牌彰显了谷歌对AI搜索志在必得的信心。

不过,随着谷歌生成式AI搜索功能开始推出,一系列负面影响随之产生:AI生成的垃圾邮件增加、原创内容的可见度下降,就连公司的现金牛——搜索广告的营收都遭到蚕食。只因AI overview会让更多用户停留在谷歌主页,而非利润丰厚的广告页面,从而影响广告的曝光和点击率。

郭涛表示,AI Overview对谷歌的搜索广告业务是把双刃剑:

一方面,它可以帮助谷歌更好地理解用户需求和行为,从而提供更加精准的搜索结果和广告推荐;

另一方面,AI Overview的误导性内容也可能会影响用户对谷歌搜索的信任度和满意度,进而影响广告收入。

一些专家认为,未来,AI Overview可能会发展出更加智能和个性化的产品形态,例如通过自然语言交互、语音识别、图像识别等技术来提供更加智能化的搜索结果和推荐。

0 阅读:103

金长春

简介:感谢大家的关注