5 月 25 日,圣彼得大教堂前,教皇利奥十四世颁布上任以来第一份通谕,标题叫《壮丽的人性》。
站在他旁边的,是 Anthropic 联合创始人 Chris Olah,Claude 的缔造者之一。
教皇警告,AI 可能成为 "统治、排斥和死亡的工具"。
Olah 说:"AI 安全不能光靠实验室自己管。"
我盯着新闻发了一会儿呆,心里翻腾出一个感受:
当顶尖 AI 工程师千里迢迢跑去梵蒂冈寻找道德背书,本身就已经是一个令人不安的信号了。
往前推两年多。
2023 年 11 月,某个星期二傍晚,OpenAI 董事会解雇了 Sam Altman,措辞是 "坦诚度存疑",没有细说。
四十八小时之内,数百名员工联署:如果 Altman 离开,我们跟着走。到了下一个周一,他回来了。
投票罢免他的董事会成员,全部出局。
表面上,四天的公司权斗。
扒开表皮看,藏着一件更让人坐立难安的东西:章程上负责问责的董事会,在真实权力面前不堪一击。它握有写进文件里的权威,Altman 握有的是由投资人、员工、合作伙伴构成的庞大网络。
章程输给了网络,输得彻底,输得安静,输得几乎没有留下任何可以事后追溯的痕迹。
AI 公司里,类似的处境普遍存在。
OpenAI 当初以非营利机构的形式创立,说要 "确保通用人工智能造福全人类"。使命高远,无可指摘。然而,使命越崇高,特权感就越容易从背后悄悄渗入。
"我们在为人类创造未来","规则适用于普通人,当然轮不到我们","提出质疑就是在拖后腿"。
研究发现,富有创造力的人,在突破边界之后,格外擅长给自身行为构建 "合理叙事":违规叫做 "突破边界",撒谎叫做 "重新定义问题"。
当心理特权感与 "改变世界" 的使命叠加,道德边界的悄然后退,就会变得极为隐蔽,也极为顺滑。
于是有人会说,Altman 是否真的做错了什么,没人能定论。
对,也正因如此,才更让人警觉。
无论当事人品格如何,当那套本来用于防范 "万一" 的问责机制在关键时刻宣告失灵,才是问题的真正所在。
坏人出事,至少还有人可以追责;问责系统本身垮了,才是连退路都没有的困境。
故事走到 2026 年,又多了一个吊诡的注脚。
2 月,《美国国家科学院院刊》发表了一项研究:科学家从 48 个国家收集逾 9 万名受访者的道德判断,与 GPT-4、LLaMA、Gemini 等主流模型的回答逐一对照,发现上述模型系统性地高估西方道德关切,低估非西方文化的价值观,即便换成当地语言提问,结果依然如此。
换句话讲:AI 的道德判断,本质上是被算力放大了的西方偏见。
偏偏,上述模型已经悄然参与进了招聘、绩效考核、医疗诊断、法律判决里的各类决策。把道德判断托付给一面有偏差的镜子,却以为照见了公正客观的事实,潜在的代价,恐怕远比多数人预想的沉重。
所以 Olah 在梵蒂冈说的那句感叹,值得反复咀嚼。
听起来像自省,实际上是认罪的另一种措辞:我们建起了这个东西,我们看清楚自己管不住,所以来找你们搭把手。
教皇欢迎。
只是教皇能帮的,究竟有多少?
他能发通谕,却无法让 OpenAI 的董事会真正发挥作用,也无法让算法停止偏向特定的道德框架。
根子上的困境,绕来绕去都是同一件事:当掌舵的人真的走偏,现有的制度,能否说出 "不" 字?
2023 年 11 月,它没能说出来。
2026 年 5 月,Chris Olah 带着悬而未决的问题走进梵蒂冈,合了张影,发了份通谕。
然后呢?
AI 还在跑,问责还在原地。
