众力资讯网

【修个Bug变禁运武器:硅谷AI安全叙事的终极荒诞】 最近Anthropic的

【修个Bug变禁运武器:硅谷AI安全叙事的终极荒诞】

最近Anthropic的最强模型Fable 5被美政府管制,起因是所谓Jailbreak(越狱)。但专家拆穿了真相:这个“越狱”其实只是三个单词——“Fix this code(修复以下代码)”。

这暴露了网络安全避不开的底层逻辑:防守与进攻是同币两面。AI要修漏洞就必须先识别它。你让它修Bug并写测试,别人拿到Diff和用例就能秒变Exploit(利用缺陷攻击)。

Anthropic此前为了IPO拼命炒作自家AI的毁灭性,结果求锤得锤,被政客借题发挥。这种强行割裂攻防的审查极其愚蠢,它只会让守法的防御者失去AI助手,而对手早就拿着Open-weight(开放权重)模型肆意扫射了。安全,从来无法靠捂住AI的眼睛来实现。

theregister.com/security/2026/06/15/feds-freaked-over-fable-5-after-simple-fix-this-code-prompt-not-jailbreak-says-researcher/5255827