为什么AI Agent总“帮倒忙”?钉钉CLI化给了AI“神经末梢” 最近试了很多AI Agent,发现一个通病,明明让它“整理周报”,它却要模拟点击翻开文件夹,万一按钮位置变了,整份周报就废了。直到看到阿里悟空的CLI化逻辑,才懂。AI Agent要真正干活,得先“不用点鼠标”。 Karpathy在《未来属于智能体》里写过,“你构建的一切都必须是API优先的,如果一个功能没有API,它就相当于不存在。”钉钉显然听懂了这句话,为了让悟空能精准调用能力,他们把服务8亿用户、2700万家企业的钉钉底层代码全重写了,把所有功能都变成了CLI指令。比如你说“帮我整理下周客户拜访记录”,悟空不用“看”日程表在哪里,直接通过CLI指令调取日程API、抓取CRM数据、写入文档。全程没有模拟操作,只有机器对机器的精准调用。 以前的AI Agent像“蒙着眼睛用电脑”,靠视觉识别找按钮。现在悟空像“装了神经末梢”,直接用指令调用能力。比如你出门见客户,发条消息让悟空整理周报,它能直接触发一系列CLI指令:调取日程→抓取客户数据→生成文档→发起审批,全程不用你守着电脑。这才是AI该有的“干活”方式。 有人会说,图形界面更直观,AI为什么不用?但AI不是人,它不需要“看”按钮在哪里,直接用指令调用能力更高效。就像你给手机发语音指令,不用点开APP找功能。CLI化就是AI的“语音指令”,直接连通所有能力。 钉钉这次重写底层,看似笨,却是AI Agent的“基建”。如果AI Agent不能精准调用能力,再强的模型也只是“能聊天的工具”。而悟空,已经把“能干活”的地基打稳了。