Anthropic模型下架 美国政府对Anthropic下了行政命令:禁止外国人访问Mythos和Fable 5。原因是Fable 5被发现可以被越狱,安全护栏没能完全锁住。
这个时间点很微妙。就在Anthropic呼吁全球暂停AI开发的同一周,美国政府跳过了"讨论要不要管"直接进入了"管住最强模型"的执行层面。速度反常地快——从发现越狱到出台命令,中间几乎没有政策滞后。
Carta上星期还写了一篇《Policy on the AI Exponential》,核心观点是政策制定速度跟不上技术发展。说得没错。但这件事暴露的是另一个问题:当企业和政府对"安全"的定义不一致时,谁说了算。Anthropic觉得一个不通用的小漏洞不构成下架理由。政府觉得你定义成武器的东西,任何漏洞都是风险。
这个争论不会有标准答案,但它把AI治理里最麻烦的那个问题推到了台面上:公司自己给能力定级,自己决定什么时候是"安全的",这套自监管的边界在哪?

