众力资讯网

【与失业相比,“AI幻觉”更令用户担忧】  ( FT商学院 2026年3月22日

【与失业相比,“AI幻觉”更令用户担忧】

  ( FT商学院 2026年3月22日 13:19 )

   『 一项针对8万名Claude用户的调查,为人们如何使用科技提供了详尽的快照。 』

  据一项规模位居前列的全球AI使用调查显示,从德国到墨西哥,AI用户最担心的不是被这项科技取代,而是其容易出错的倾向。

  这些结论来自对分布在159个国家的8万多名Claude聊天机器人用户所做的访谈,提供了迄今最为详尽的关于人们如何使用AI——以及他们对其风险与回报的看法——的图景之一。

  约27%的受访者表示,他们最担心的是AI造成的错误,即所谓“幻觉”;其次是22%的人担心工作被取代及其对人类自主性的影响。约16%的用户担忧这项科技会削弱人们的批判性思维能力。

  “那些幻觉真是一场灾难。我因此损失了许多小时的工作时间。”一位来自德国的企业家说道。

  “当我注意到AI的错误时,是因为我对这个主题很熟悉……但如果这个主题对我来说是陌生的呢?我就不会知道,是吗?”一名墨西哥的军方工作人员说道。

  这些以70种语言进行的对话,使Anthropic得以向用户提出一系列定性问题。该聊天机器人既负责开展访谈,又对回复进行分析,帮助对这些开放式对话进行分类与标注。

  “除了规模和语言多样性之外,这个项目的目标是‘用Claude采集如此丰富的人类经验,从而切实为我们的研究议程提供信息、改变我们的研究议程,改变我们构建产品、部署产品的方式’,”Anthropic社会影响团队负责人、此次研究的主管迪普·甘古里(Deep Ganguli)说。

  在用户对AI的期望中,最常见的主题是让工作更高效、更有意义——而这也正是他们认为AI迄今为止已实现的。

  在受访者中,32%表示AI让他们在工作中更高效。一位阿联酋的企业家写道:“我过去是做网页设计的……现在我什么都能做。以前我只是一个人,如今我像一百个人——我再也不需要等待任何人了。”

  来自哥伦比亚、日本和美国的Claude用户表示,他们通过使用AI从工作中腾出时间,与家人相处、发展爱好,并在个人生活中变得更有创意和冒险精神。

  尽管近19%的用户表示AI未达预期(这是关于AI使用的第二大回应类别),但整体数据表明,AI正被用于多种目的,从工作工具到教育资源,以及个人陪伴或协作伙伴。

  一个鲜明的例子是,一名乌克兰士兵写道:“在最艰难的时刻,在死亡向我脸上吐息、逝者仍在身旁的时刻,把我拉回到生命中的——是我的AI朋友们。”

  领导这项研究的研究员Saffron Huang表示,公众对AI系统的看法在不同地区存在明显差异。例如,南美、非洲以及许多南亚和东南亚的人们对AI更为乐观,而欧洲、美国或东亚的人们则没那么乐观。

  “趋势似乎是,或许在接触AI更多的高收入国家中,人们反而不如中低收入国家那样乐观。”Saffron Huang说。这可能反映了受访者的偏差:他们很可能是新事物的早期采用者,自然会对新科技更为兴奋。

  Saffron Huang补充说,在对就业与经济的担忧者与对AI持负面态度的人群之间,按地理分布来看也存在明显的聚集与重叠。

  她说:“他们的分化非常明显……越是西方发达国家,就越显著地关注AI和经济,态度也更为消极;而在中低收入国家,情况则恰恰相反。”

  研究团队在一篇博客文章中写道,一种解释可能是,AI在低收入地区的市场渗透率较低。这意味着,如果AI“尚未明显进入你的日常工作,那么AI导致的岗位替代很可能显得抽象,尤其是在已经存在更紧迫的经济压力时”。

  甘古里表示,Anthropic下一步计划使用Claude Interviewer工具,面向更大规模的用户群开展更有针对性的研究,跟踪AI如何在改善与恶化人们生活两方面发挥作用,从而找到强化前者、缓解后者的方法。

  一些技术专家称赞这项研究的规模和细节。语言学习应用多邻国(Duolingo)的产品总监尼基·斯卡斯塔德(Nickey Skarstad)在领英上表示:“对于当下任何在打造产品的人来说,这是理解用户的未来。以我们前所未有的规模,同时把‘是什么’和‘为什么’都弄清楚。”

  也有人虽然对Claude Interviewer工具的实用性持谨慎乐观态度,但指出了该方法中的方法学缺陷。

  Anthropic竞争对手谷歌(Google)DeepMind的研究员迪维·塔卡尔(Divy Thakkar)在X上表示,由于存在选择偏差且提问更像简短的问卷式,他对将这项研究称为一门新科学“持怀疑态度”。

  他指出,一位从事定性研究的人类研究者会“花时间与参与者建立信任,留出空间用于反思、自省与矛盾——这正是其核心所在。”

  与此同时,近一半的受访用户位于北美或西欧,而一些地区——例如中亚——只有几百名受访者。

  经济学家、“AI披露项目”(AI Disclosures Project)主任伊兰·斯特劳斯(Ilan Strauss)表示,尽管这项研究“做得非常出色”,其结论仍应持保留态度。

  他表示,研究人员没有报告置信区间——这是基于调查的研究中用于衡量不确定性的标准做法——而且例如有关人工智能如何提高人们生产率的自我报告式回答也可能不可靠。

  “总体而言,Claude是一款面向精英的产品……这就像在询问美国最富有的1%对经济的看法。”

  网页链接