这两天,Anthropic 干了一件很有意思的事。
一个因为 "太危险" 而不敢放出来的模型,现在堂而皇之地公开了。
美东时间 6 月 9 日,Anthropic 同时发布了 Claude Fable 5 和 Claude Mythos 5。两个模型,同一套底层架构,一个给大众用,一个给 "可信机构" 用。
Fable 5 是正式面向公众开放的,Mythos 5 则依然关在笼子里,只通过 Project Glasswing 项目,向美国政府、关键基础设施运营商、网络安全机构这类经过严格审核的组织开放。
今年早些时候,Anthropic 第一次亮出 Mythos Preview 的时候,把整个 AI 圈吓了一跳。他们罕见地主动公开警告说,这个模型能在主流操作系统和浏览器里找漏洞、利用漏洞,网络攻防能力强到他们自己都不敢放出来。
这在 AI 公司里几乎没有先例,毕竟大家一般都是争先恐后往外推产品,抢用户、抢市场,哪有主动踩刹车的?
Anthropic 就这么踩了。
然后憋了一段时间,想明白了一个办法:我不是不让你用,我是让你用 "阉割版"。
Fable 5 的具体操作是,凡是涉及网络安全、生物学、化学、模型蒸馏这些敏感方向的提问,系统会悄悄把请求转给 Claude Opus 4.8 处理,而不是 Fable 5 本体出手。说是触发率不足 5%,也就是说,绝大多数情况你根本感觉不到这道隐形门槛的存在。
为了验证这套安全机制靠不靠谱,Anthropic 内部做了超过 1000 小时的越狱测试,专门找人想办法绕过去,结果说没找到能普遍奏效的破解方案。
当然,这话得听个七八成,没有任何系统是真正无懈可击的,只是目前的防护经受住了测试而已。
能力这边,数字确实很唬人。
Stripe 拿它在一个 5000 万行 Ruby 代码的库里做代码迁移,一个人花一天干完了原本一个团队要做两个月的活。
视觉理解也上了台阶,仅凭截图就能重建网页应用的源代码。
Anthropic 还说 Fable 5 仅靠视觉输入通关了《Pokémon FireRed》,而此前版本的 Claude 需要额外辅助工具才能搞定。
生命科学那边更夸张。
Mythos 5 被描述为能够独立完成蛋白质设计流程,在部分药物研发任务中达到甚至超过专业研究人员水平。Anthropic 的研究团队还说,模型提出的一个关于大肠杆菌蛋白的新机制假说,后来被独立实验室的实验结果验证了。
这话如果是真的,那意义相当深远,因为这意味着 AI 已经开始在科学研究的最前沿产生实质性贡献,而不只是帮人写代码和改邮件。
定价是 10 美元/百万输入 Token、50 美元/百万输出 Token,约是 Opus 4.8 的两倍,但 Anthropic 说 Fable 5 的效率提升足以抵消成本差。
时间节点也颇为微妙。
5 月底刚完成 65 亿美元融资,投后估值 965 亿美元,超过 OpenAI 成为全球估值最高的 AI 创业公司之一。
6 月初秘密提交 IPO 申请文件,最快今秋上市。
这个时间节点推出 Fable 5,怎么看都有一层 "让资本市场放心" 的意味在里面:
你看,我们不只是会搞研究的学院派,我们会做商业产品,而且还能把最危险的技术驯化成可以卖钱的东西。
这其实是个相当精妙的叙事设计。
大多数 AI 公司的逻辑是:能力越强越好,安全问题以后再说。
Anthropic 从一开始就把 "安全" 当作自己的差异化标签,但这个标签也有代价,那就是你不能光嘴上说安全,有时候你真的要把产品压着不发。
Mythos Preview 那次就是这么操作的,代价是短期内少了一块市场,换来的是 "Anthropic 真的在乎安全" 的口碑积累。
现在,Fable 5 相当于把这套逻辑推进到了下一个阶段:我不只是会克制,我还找到了一套在能力和安全之间走钢丝的方法。对监管机构来说这是个好故事,对资本市场来说这也是个好故事。
至于这套动态路由加权限控制的安全机制,长期来看能不能真的顶住压力,就另说了。
毕竟技术上的边界,从来都是在被反复试探中不断收窄的。
