众力资讯网

刚刚!马斯克强势发布Grok 4.1

11月18日,马斯克旗下xAI宣布推出最新前沿模型Grok4.1,这是Grok系列迄今最大幅度的一次升级。官方称其在“对话智能、情绪理解和现实世界任务能力”等方面全面突破,并已在Arena榜、EQ-Bench、CreativeWritingV3等核心榜单上取得领先。

Grok4.1已面向所有用户免费开放,可通过grok.com、grok.x.com及移动端App使用。马斯克本人也第一时间转发并表示,用户会“明显感受到速度和质量的提升”。

多项榜单冲顶:对话推理、情绪理解、写作能力全面跃升

根据xAI公布的数据:

1)Arena榜单第一名:1483Elo

Grok4.1-thinking与Grok4.1分列第一、第二,领先最近的非xAI模型31分,属于断档式优势。

2)情绪智商EQ-Bench第一名

Grok4.1Thinking在EQ-Bench情绪智能测试中拿到1586Elo,是迄今表现最强的模型,在“情绪识别、共情、人际理解”等维度上显著提升。

3)写作能力暴涨600分

在CreativeWritingV3中,Grok4.1拿到1722Elo,比上一代提升高达600分,追平甚至逼近早期GPT-5.1Polaris的水平。

4)幻觉率下降3倍

官方称Grok4.1是目前最不易产生幻觉的Grok模型,相比早期Grok4Fast幻觉率下降超过3倍。

用户实测:65%情况下更偏爱Grok4.1的回答

xAI表示,团队在11月前两周对小规模用户悄然灰度测试了Grok4.1。在对比中,用户在65%的对战结果中更喜欢Grok4.1的回复。

这意味着模型升级不仅仅是参数层面的,更在实际交互体验上得到显著认可。

免费开放:所有用户可直接使用最新Grok

与其他厂商不同,xAI将Grok4.1面向所有用户免费开放,包括非订阅用户。目前:

grok.com

grok.x.com

grok移动端App(grok.com/download)

均已同步模型。

Grok的战略:用“情绪智能”和“真实世界可用性”建立差异化

从此次升级可以看出,xAI正在有意识地强化Grok在以下三条赛道的竞争力:

1.情绪理解与共情能力EQ

这是ChatGPT、Gemini、Claude尚未完全攻克的“人际感知”维度,Grok此次大幅领先EQ-Bench,策略意义明显。

2.任务实用性和减少幻觉

降低错误率意味着Grok在搜索、决策、推荐等结构化任务中更具可用性。

3.快速推理+创意写作

兼具速度与创造力,有利于进军创作工具与社交场景。

Grok4.1的定位正逐步从“另类、有梗”向“强推理、有温度、能办事”的通用助手转变。

Grok4.1不再靠“嘴臭”吸睛,而是用EQ、写作和速度争夺下一代AI助手的核心场景。(转载自AI普瑞斯)