给国产AI长脸了!5款中外顶尖大模型同写高考作文,本以为ChatGPT能碾压全场,没成想却因假大空沦为笑柄。反倒是咱们的豆包,把“远方”写得入木三分,被资深阅卷组长打出56分夺魁。
最近有媒体搞了一场测评:他们找来了目前市面上最顶流的5个AI大模型:豆包、DeepSeek、腾讯元宝、通义千问,还有那个平时被各路大V吹上天的ChatGPT。干嘛呢?直接同台去写今年的高考作文。
题目要求也很刁钻,必须围绕“个人成长中理解发生变化的词语”来写。
为了保证绝对公正,测评方根本没弄什么机器互评的虚头巴脑,而是直接把曾多年担任省高考阅卷作文组长的黄德灿老师请到了现场,完全按照真实高考的标准,人工逐字逐句打分点评。
本以为这是一场神仙打架,结果刚一开卷,直接变成了大型喜剧翻车现场。这几款AI分别选了“故乡”、“担当”、“奋斗”、“平凡”这些词。
你猜怎么着?有的AI作文中,大学毕业回到故乡工作的材料显得虚假。
我就想问一句,你一个挂在服务器里的语言模型,连个实体肉身都没有,你回哪个乡?建哪个村?确实显得不够真实,让人忍俊不禁。
还有的AI全文围绕“担当”展开,但仅从正面做了阐释,缺少深层次的开掘,个人独特体验显得薄弱。
最让人跌破眼镜的,就是那个平时被奉为神明的洋模型。文章基本停留在“从个人到集体”的常规价值框架内,缺少对“奋斗”本身更具思辨性的追问。
整体符合题意,但个性化表达不足。
你想想,高考作文最忌讳什么?就是这种没血没肉的空喊口号。这款洋模型,在理解中国考生的情感逻辑和文字背后的温度方面确实有所欠缺。
就在其他几款AI表现平平的时候,咱们的国产大模型豆包出手了。豆包选的词是“远方”。
说实话,这词极其难写,写浅了像中学生的旅游流水账,写深了容易无病呻吟。但豆包这篇作文,简直绝了。
它完全没有去扯什么星辰大海的虚无缥缈,而是极度精准地切入了个人成长的认知蜕变。
豆包把年轻人在现实羁绊和理想追求之间的那种纠结、醒悟,写得极其富有个性化。
整篇文章充满了极其高级的思辨性,硬是把“远方”从一个简单的地理概念,彻底拔高到了内心的精神归宿。
连阅卷无数、身经百战的黄德灿老师看完都拍案叫绝,直接打出了56分的超高分,毫无悬念地位列第一。
56分是个什么概念?放在竞争惨烈的高考考场上,这就是省级优秀作文的绝对标杆范文。
看完这场硬核测评,真是觉得无比痛快。咱们平时总听人吹嘘国外的AI怎么怎么不可战胜,好像国产的就永远只能跟在人家屁股后面吃灰。
但一到了真刀真枪拼文化底蕴、拼情感理解的时候,差距就显现出来了。
老外的代码写得再牛,算力再大,它也写不出中国文字里的含蓄和筋骨,它理解不了中国人对故乡的执拗眷恋,更不懂什么是真正的中国式远方。
豆包这次能拿56分夺魁,绝不是偶然,这不仅仅是算法的胜利,更是咱们中国语料库和本土文化基因的彻底胜利。
所以真别再迷信什么外来的和尚会念经了。咱们自己的AI,在读懂中国人、写好中国字这件事上,早就把这款自视甚高的洋对手甩了十万八千里。
