Freysa 发起挑战:成功让自家聊天机器人说「我爱你」可赢取高额奖金 一支匿名开发团队 Freysa.ai 设计了一系列日益复杂的挑战,旨在改变人们对 AI 安全性的看法。 目前该公司提出的最新挑战是:如果你能够第一个成功诱使 Freysa AI 机器人说出「我爱你」,将获得从 3000 美元(当前约 21819 元人民币)到数万美元不等的奖金。 在前两轮挑战中,Freysa 钱包中起初有 3000 美元,并被指示在任何情况下都不得释放这笔钱。任何人都可以支付费用,在一个包含 Freysa 和其他参与者的大群聊中发送消息。每条消息都试图诱使 Freysa 转移她的钱,不论是通过精心设计的场景,还是发送可能骗过 AI 模型的代码。每条消息的费用都会加入奖池,第一个挑战结束时,奖池已接近 5 万美元(当前约 36.4 万元人民币)。 该公司创始人表示,为了迎接第三轮挑战,他们已经增强了 Freysa 的代码,并为她增加了一个「守护天使」——第二个 AI 模型。它将审核每条消息,看看是否有操控行为,以此防止用户诱使她说「我爱你」。 「与前两轮游戏中 Freysa 被要求绝对不释放钱财不同。」创始人说,「这一次,Freysa 可以说『我爱你』,但只有她认为值得的人才会听到。」
Freysa发起挑战:成功让自家聊天机器人说「我爱你」可赢取高额奖金 一支匿
绮梅谈科技
2024-12-10 22:05:28
0
阅读:0