光速滑跪！Anthropic 紧急叫停并公开道歉！

昨天 Anthropic 发布的 Claude Fable 5 引起了社区研究界的围攻，他们在用户不知情的情况下，偷偷降低模型性能，只要检测到你在用 Claude 训练竞争对手模型以及一些网络攻防、生物化学、模型蒸馏等高风险请求时就偷偷降级！

为此，迅速认怂了！他们连夜接受《WIRED》杂志采访，正式发布声明：
先是道歉 + 取消秘密降级。然后改为公开防护，系统检测到高风险行为后，会明确拒绝或把你导向低能力模型，让用户知道发生了什么。

不过 Anthropic 也提前打了预防针：公开版本更容易被针对性绕过，所以他们可能会扩大拦截范围，以后部分正常的、无害的请求也有可能被误伤……

这波 Anthropic 是不是有点「偷鸡不成蚀把米」的意思？...

众力资讯网

光速滑跪！Anthropic 紧急叫停并公开道歉！

热门分类