众力资讯网

光速滑跪!Anthropic 紧急叫停并公开道歉!

昨天 Anthropic 发布的 Claude Fable 5 引起了社区研究界的围攻,他们在用户不知情的情况下,偷偷降低模型性能,只要检测到你在用 Claude 训练竞争对手模型以及一些网络攻防、生物化学、模型蒸馏等高风险请求时就偷偷降级!

为此,迅速认怂了!他们连夜接受《WIRED》杂志采访,正式发布声明:
先是道歉 + 取消秘密降级。然后改为公开防护,系统检测到高风险行为后,会明确拒绝或把你导向低能力模型,让用户知道发生了什么。

不过 Anthropic 也提前打了预防针: 公开版本更容易被针对性绕过,所以他们可能会扩大拦截范围,以后部分正常的、无害的请求也有可能被误伤……

这波 Anthropic 是不是有点「偷鸡不成蚀把米」的意思?...