Anthropic CEO 发万字檄文:DeepSeek 崛起,白宫应加码管制(下)
摘自金色传说大聪明 赛博禅心
出口管制
以上所有内容都只是我主要关注话题——对华芯片出口管制——的铺垫。根据上述事实,我对当前形势的看法如下:
即使曲线周期性地发生偏移,训练特定智能水平模型的成本迅速下降,但各公司在训练强大人工智能模型上的支出却持续增加。这仅仅是因为训练更智能模型的经济价值实在太大了,以至于任何成本上的节省几乎都立即被抵消——它们被重新投入到制造更智能的模型中,花费的仍然是最初计划支出的巨额资金。DeepSeek 开发的效率创新,如果美国实验室尚未发现,也将很快被美国和中国实验室应用于训练数十亿美元的模型。这些模型将比他们之前计划训练的数十亿美元模型性能更优——但他们仍然会花费数十亿美元。这个数字将继续上升,直到我们达到人工智能在几乎所有事情上都比几乎所有人类更智能的程度。
制造出在几乎所有事情上,都比几乎所有人类更智能的人工智能,将需要数百万块芯片、数百亿美元(至少),并且最有可能在 2026-2027 年实现。DeepSeek 的成果发布并没有改变这一点,因为它们大致符合一直被纳入这些计算的预期成本降低曲线。
这意味着在 2026-2027 年,我们可能会最终进入两个截然不同的世界之一。在美国,多家公司肯定会拥有所需的数百万块芯片(以数百亿美元的成本)。问题是中国是否也能获得数百万块芯片?
如果中国能够做到,我们将生活在一个两极世界中,美国和中国都将拥有强大的人工智能模型,这将导致科学和技术的飞速发展——我称之为“数据中心里的天才之国”。两极世界不一定会无限期地保持平衡。即使美国和中国在人工智能系统方面势均力敌,中国似乎也更有可能将更多的才能、资本和关注力投入到该技术的军事应用中。结合其庞大的工业基础和军事战略优势,这可能有助于中国在全球舞台上取得支配地位,不仅在人工智能领域,而且在所有领域。
如果中国无法获得数百万块芯片,我们将(至少暂时)生活在一个单极世界中,只有美国及其盟友拥有这些模型。单极世界是否会持久尚不清楚,但至少存在一种可能性,即由于人工智能系统最终可以帮助制造更智能的人工智能系统,暂时的领先优势可能会转化为持久的优势。因此,在这个世界中,美国及其盟友可能会在全球舞台上取得支配且持久的领先地位。
有效执行的出口管制是唯一能够阻止中国获得数百万块芯片的手段,因此也是我们最终会进入单极世界还是两极世界的最重要决定因素。
DeepSeek 的出色表现并不意味着出口管制失败。正如我上面所述,DeepSeek 拥有相当数量的芯片,因此他们能够开发并训练出一个强大的模型并不令人意外。他们的资源约束程度并不比美国人工智能公司高多少,出口管制也不是导致他们“创新”的主要因素。他们只是非常有才华的工程师,并表明中国是美国的一个强大竞争对手。
DeepSeek 也不能证明中国总能通过走私获得所需的芯片,或者证明管制措施总是存在漏洞。我不认为出口管制的目的曾经是阻止中国获得数万块芯片。10 亿美元的经济活动可以被掩盖,但 1000 亿美元甚至 100 亿美元的经济活动却很难隐藏。数百万块芯片在物理上也可能难以走私。
审视一下目前报道的 DeepSeek 拥有的芯片也具有启发意义。根据 SemiAnalysis 的说法,这是一个由 H100、H800 和 H20 组成的混合体,总计 5 万块。H100 自发布以来就受到出口管制禁令的限制,因此如果 DeepSeek 拥有任何 H100,那一定是走私来的(请注意,英伟达已声明 DeepSeek 的进展“完全符合出口管制规定”)。H800 在 2022 年最初的出口管制措施下是允许的,但在 2023 年 10 月管制措施更新时被禁止,因此这些芯片可能是在禁令之前发货的。H20 的训练效率较低,采样效率较高——并且仍然是允许出口的,尽管我认为应该禁止出口。
总而言之,DeepSeek 人工智能芯片舰队的很大一部分似乎是由以下芯片组成:尚未被禁止的芯片(但应该被禁止);在被禁止之前发货的芯片;以及一些非常可能走私来的芯片。这表明出口管制实际上正在发挥作用并不断调整:漏洞正在被堵塞;否则,他们很可能拥有全部由顶级的 H100 组成的芯片舰队。如果我们能够足够快地堵塞漏洞,我们或许能够阻止中国获得数百万块芯片,从而增加美国领先的单极世界出现的可能性。
考虑到我对出口管制和美国国家安全的关注,我想明确一点。我不认为 DeepSeek 本身是对手,重点也不是专门针对他们。在他们接受的采访中,他们看起来像是聪明的、充满好奇心的研究人员,只是想创造有用的技术。
如果中国能够在人工智能领域与美国匹敌,这个他们会是令人恐慌的。出口管制是我们阻止这种情况发生的最有力工具之一,认为技术变得更强大、性价比更高就应该放松出口管制,这种想法根本毫无道理。