众力资讯网

ChatGPT-5.2 上线!全面超越 Claude Opus4.5 及 Gemimi 3.0 Pro

OpenAI 这次,豁出去了!GPT-5.2 正式上线,一次性甩出三个版本:Instant、Thinking、Pro说句

OpenAI 这次,豁出去了!

GPT-5.2 正式上线,一次性甩出 三个版本:Instant、Thinking、Pro

说句不夸张的,现在这个状态,Claude Opus 4.5 和 Gemini 3 Pro,基本都被甩在后视镜里了。

先说最硬的部分,看数据。在一堆核心基准测试里,GPT-5.2 Thinking 几乎全线第一。

做程序的最看重 SWE-Bench Pro,它跑到了 55.6%,Claude 只有 52%,Gemini 更低。

偏科研的 GPQA Diamond,直接 92.4%,比上一代 5.1 又高了一截。数学更狠,AIME 2025 直接满分 100%,这个分数一出来,基本就不用多解释了。抽象推理 ARC-AGI-2,也明显拉开差距,Claude 和 Gemini 都被压了一大段。高等数学 FrontierMath,GPT-5.2 还是第一。

这些数字放在一起,其实只说明一件事:推理能力已经不是同一代水平了。

但真正让我觉得不一样的,是一个叫 GDPval 的评测。

它不考你会不会刷题,而是直接拿真实工作来测,涵盖 40 多种职业,比如做 PPT、做表格、写方案、整理文档。

结果是,GPT-5.2 Thinking 赢了 70.9% 的人类专家。注意,是行业里真正干这活的人。上一代 GPT-5 Thinking 只有 38.8%,连一半都不到。这一次,OpenAI 第一次明确站到了“人类专家水平”这条线上。

再说这三个版本怎么用。

Thinking 很明确,就是干重活的。长上下文推理明显更稳,表格分析、数据整理更顺,PPT 也终于像点样子了,适合真正拿来做专业工作的那种。

Instant 走的是日常路线。对话更自然,说话不冷,解释问题更清楚,重点先给你,写教程、做指南、搞技术说明都更顺手,对学习和职场帮助挺大。

Pro 就一句话:最聪明,也最稳。写复杂代码、做科研辅助,明显比前面两个更强。

上线节奏也很直接。Plus、Pro、Business、Enterprise 用户,今天就能用。Free 和 Go 用户,明天开放。API 和 Codex 已经同步更新。

OpenAI 也说了,GPT-5.2 只是这一轮升级的一部分,后面还会继续优化,比如减少莫名其妙的拒答、缩短响应延迟。至于 GPT-5.1,付费用户还能再用三个月,当作老版本保留。

模型在往前跑,循环没停。这一次,终于轮到 OpenAI 喊一句:“到我了。”

如果你不知道如何升级ChatGPT plus5.2会员,可以找我呀:gptpro2233