众力资讯网

Claude刚把OpenAI打疼,文心也被海外点名了

最近AI圈有个信号,挺值得琢磨。
过去聊全球大模型,很多人默认还是OpenAI坐主桌,中国模型更多是追赶叙事。但这两天Arena和SuperCLUE的两组信息放在一起看,味道有点变了。

在Arena最新发文里引用斯坦福人工智能指数提到,自2025年初以来,中美大模型已经多次交替领先,整体差距收窄到大概2.7%。

其中在文本赛道里,美国最突出的还是Anthropic的Claude Opus 4.6 Thinking,中国这边则是以文心5.1为代表。

这句话其实信息量挺大。
在全球评测语境里,外界正在把Claude和文心放到了同一张桌子上讨论。

同一天,SuperCLUE-Writing也放出中文原生创意写作专项测评基准,文心5.1拿到87.57分,创意写作国内第一、全球第二,综合表现还超过了Gemini-3.1-Pro-Preview、GPT-5.5(xhigh)、DeepSeek-V4-Pro(max)这些国内外主流模型。

挺有意思的是,第一名是Claude。这真有点你追我赶、针尖对麦芒的感觉。

所以你会发现,这轮AI叙事有点微妙了:
美国那边,不只是OpenAI一家说了算,
中国这边,像文心这样的老牌玩家,也在海外狂刷存在感。

Claude在美国对OpenAI形成压力,文心在中国接连登榜、被海外讨论。这俩放在一起看,像是中美AI各自跑出了一条“逆袭线”。

文心这也不算突然冒出来,它过去一直很多能力藏在搜索、知识、写作、智能体这些长期积累里。

像我也是等到文心5.1一发布,百度文心登顶、海外开始讨论,才发现这事好像没那么简单了。

OpenAI不再稳坐唯一叙事中心,中国模型也不只是跟跑了。