众力资讯网

高考数学难上热搜?6家AI实测谁是真学霸

数学高考刚结束,热搜就炸了。“数学一卷喜提大专”刷屏,考生们集体吐槽最后一道题难到离谱,甚至有人给它封了个“史上最难高考压轴题”的名号。

为了验证这道题的难度,有机构用6个主流AI模型做了实测。

6个AI做全国I卷,原卷扫描直接输入,模拟学生拍照上传,不做任何预处理。全程无网络、无外挂,纯靠模型自己的推理能力,解答题按“过程分+结果分”双维度人工阅卷。

前10道基础题,6家全部答对,谁都没掉队,但从第11题开始,差距慢慢显现。真正的分水岭是压轴第19题,一道新定义题型,涉及集合、逻辑推理和反证法,需要现场理解规则、现学现卖。这种题,靠死记硬背是没用的。

最终成绩千问150分,是唯一拿到满分的,其他模型在此题均有不同程度失分。

千问在第19题的表现确实稳。第一问集合推导滴水不漏,第二问奇函数性质推理严谨,第三问反证法构造精妙,最后验算也没有纰漏。

整个过程步骤完整、逻辑清晰,符合高考数学对“严密性”的高要求。

其他模型有的在分类讨论环节卡了壳,有些是过程与结果上失误。

以前大家担心AI会不会做题,现在发现AI最怕的是做题不“稳”。基础题大家都对,真正拉开差距的是最后那道“一步错步步错”的压轴题,数学考的不只是知识,压轴题更是推理能力的试金石,和面对陌生题型的迁移能力。

对考生来说,这套测评也说明一件事,高考数学考的不是你见过多少题,是你没见过的时候能不能推出来,AI也一样。千问能拿到满分,靠的不是参数大,是扎实的训练基础。

AI数学测评 高考数学