这两天，Anthropic 干了一件很有意思的事。一个因为 "太危险" 而不敢

这两天，Anthropic 干了一件很有意思的事。
一个因为 "太危险" 而不敢放出来的模型，现在堂而皇之地公开了。
美东时间 6 月 9 日，Anthropic 同时发布了 Claude Fable 5 和 Claude Mythos 5。两个模型，同一套底层架构，一个给大众用，一个给 "可信机构" 用。
Fable 5 是正式面向公众开放的，Mythos 5 则依然关在笼子里，只通过 Project Glasswing 项目，向美国政府、关键基础设施运营商、网络安全机构这类经过严格审核的组织开放。

今年早些时候，Anthropic 第一次亮出 Mythos Preview 的时候，把整个 AI 圈吓了一跳。他们罕见地主动公开警告说，这个模型能在主流操作系统和浏览器里找漏洞、利用漏洞，网络攻防能力强到他们自己都不敢放出来。
这在 AI 公司里几乎没有先例，毕竟大家一般都是争先恐后往外推产品，抢用户、抢市场，哪有主动踩刹车的？
Anthropic 就这么踩了。
然后憋了一段时间，想明白了一个办法：我不是不让你用，我是让你用 "阉割版"。

Fable 5 的具体操作是，凡是涉及网络安全、生物学、化学、模型蒸馏这些敏感方向的提问，系统会悄悄把请求转给 Claude Opus 4.8 处理，而不是 Fable 5 本体出手。说是触发率不足 5%，也就是说，绝大多数情况你根本感觉不到这道隐形门槛的存在。
为了验证这套安全机制靠不靠谱，Anthropic 内部做了超过 1000 小时的越狱测试，专门找人想办法绕过去，结果说没找到能普遍奏效的破解方案。
当然，这话得听个七八成，没有任何系统是真正无懈可击的，只是目前的防护经受住了测试而已。

能力这边，数字确实很唬人。
Stripe 拿它在一个 5000 万行 Ruby 代码的库里做代码迁移，一个人花一天干完了原本一个团队要做两个月的活。
视觉理解也上了台阶，仅凭截图就能重建网页应用的源代码。
Anthropic 还说 Fable 5 仅靠视觉输入通关了《Pokémon FireRed》，而此前版本的 Claude 需要额外辅助工具才能搞定。

生命科学那边更夸张。
Mythos 5 被描述为能够独立完成蛋白质设计流程，在部分药物研发任务中达到甚至超过专业研究人员水平。Anthropic 的研究团队还说，模型提出的一个关于大肠杆菌蛋白的新机制假说，后来被独立实验室的实验结果验证了。
这话如果是真的，那意义相当深远，因为这意味着 AI 已经开始在科学研究的最前沿产生实质性贡献，而不只是帮人写代码和改邮件。
定价是 10 美元/百万输入 Token、50 美元/百万输出 Token，约是 Opus 4.8 的两倍，但 Anthropic 说 Fable 5 的效率提升足以抵消成本差。

时间节点也颇为微妙。
5 月底刚完成 65 亿美元融资，投后估值 965 亿美元，超过 OpenAI 成为全球估值最高的 AI 创业公司之一。
6 月初秘密提交 IPO 申请文件，最快今秋上市。
这个时间节点推出 Fable 5，怎么看都有一层 "让资本市场放心" 的意味在里面：
你看，我们不只是会搞研究的学院派，我们会做商业产品，而且还能把最危险的技术驯化成可以卖钱的东西。
这其实是个相当精妙的叙事设计。

大多数 AI 公司的逻辑是：能力越强越好，安全问题以后再说。
Anthropic 从一开始就把 "安全" 当作自己的差异化标签，但这个标签也有代价，那就是你不能光嘴上说安全，有时候你真的要把产品压着不发。
Mythos Preview 那次就是这么操作的，代价是短期内少了一块市场，换来的是 "Anthropic 真的在乎安全" 的口碑积累。
现在，Fable 5 相当于把这套逻辑推进到了下一个阶段：我不只是会克制，我还找到了一套在能力和安全之间走钢丝的方法。对监管机构来说这是个好故事，对资本市场来说这也是个好故事。

至于这套动态路由加权限控制的安全机制，长期来看能不能真的顶住压力，就另说了。
毕竟技术上的边界，从来都是在被反复试探中不断收窄的。

众力资讯网

这两天，Anthropic 干了一件很有意思的事。一个因为 "太危险" 而不敢

热门分类

这两天，Anthropic 干了一件很有意思的事。 一个因为 "太危险" 而不敢

热门分类

这两天，Anthropic 干了一件很有意思的事。一个因为 "太危险" 而不敢