最近刷手机总刷到AI相关的新鲜事。
以前都是咱们给ChatGPT、Claude这些AI工具评好坏、排先后,现在倒好,AI反过来给人打分了。
Anthropic公司在自家的Claude里加了个新功能,专门测用户的AI使用水平,还没正式上线呢,灰度测试阶段就已经传开了。
这个功能有意思就有意思在“反向操作”,以前都是工具听人的,现在人要被工具评判。
它会扫你之前和各种AI的聊天记录,按11项指标打分,满分11分,已经有网友测出来7.5分的成绩。
这11项指标其实就围绕三个关键点,正好戳中了咱们很多人用AI的毛病。
第一个是需求说不说得明白,不少人用AI就跟随口问问题似的,一句“写个文章”就扔过去,结果AI给的东西根本不是自己想要的。
但会用的人不一样,能把需求拆得明明白白,比如“帮我写一份面向中老年群体的健康饮食分享,重点讲清淡烹饪,字数控制在800字左右”,这么一说,AI输出的质量自然天差地别。
第二个是敢不敢质疑,AI给出的内容排版工整、文字流畅,看着就像那么回事,很多人直接复制粘贴就用,压根没想过里面可能有逻辑漏洞或者数据错误。
这个评分功能就是要提醒大家,再精美的内容也得自己过一遍脑子,不能完全当甩手掌柜。
第三个是会不会接着优化,有些人问一次AI没得到满意答案就放弃了,觉得AI没用。
但高分用户会像教新手一样引导AI,比如“这个建议太笼统,能不能举个具体的家常菜例子”“能不能补充一下食材选购的注意点”,一步步让AI贴近自己的需求。
有数据显示,85.7%的高质量对话都来自这种愿意迭代的用户,只会一次性提问的人,根本没发挥出AI的真正价值。
更值得注意的是,AI要是给出PDF或者带链接的界面,大家的警惕心会明显下降,质疑的概率都变少了。
想想咱们自己,是不是也有过拿AI给的方案直接用,后来才发现问题的经历,这个评分功能就像一面镜子,能照出咱们用AI时到底有没有偷懒。
现在虽然还只是灰度测试,但已经有不少人盼着正式上线了,毕竟比起给AI打分,知道自己到底会不会用AI,才是真能帮上忙的事。
以后用AI再也不能稀里糊涂了,不然被AI打个低分,说出去都有点不好意思呢。


