高考数学题对AI而言究竟有多难?今年高考,数学和物理的难度让考生们苦不堪言。有人拿试卷去测试GPT - 5.5和Claude 4.8,结果AI“挂科”,其文科方面的优势在理科考场上被彻底粉碎。在解答解析几何或电磁感应大题时,AI逻辑混乱,陷入了“一步错,步步错”的死循环。
然而,也存在不同的情况。2026年对6款主流大模型开展高考数学测评,它们的解题能力呈现出梯队分化,其中一款大模型取得了148分的好成绩。由此可见,当下大模型的数学能力竞争已转向“过程严谨、逻辑完整、复杂问题可拆解”的高阶比拼。
