为什么 AI 时代 CLI 突然又香了
GUI 是给眼睛用的,按钮、菜单、图标,鼠标点来点去。CLI 是给文字用的,一行命令,回车,搞定。过去三十年我们一直在 GUI 化,理由很简单,人类记不住命令,但看得懂图标。可大模型出现之后,游戏规则变了。
AI 没有眼睛。它是文字进、文字出的物种。让它去看屏幕、识别按钮、模拟鼠标点击,本质是逼一个用文字思考的家伙去做视觉劳动。截图传给 LLM 烧 Token、状态藏在像素背后看不清、分辨率一变坐标就失效,又慢又贵又脆。
CLI 正好相反。文本输入、结构化输出、报错清晰、管道可组合,这些特性 AI 学起来零成本,它训练时本来就读过海量命令行语料,CLI 是它的母语。想让 AI 帮你发条消息到群里?它不会去飞书点开聊天框、找群、输入文字、按发送,而是一行命令搞定:
lark-cli im +messages-send --chat-id "oc_xxx" --text "Hello"
四步操作压成一行,中间不用动鼠标。这也是为什么飞书、钉钉、企微、谷歌、Stripe 最近集体开源 CLI。一个设计良好的 CLI,把执行能力、调用协议、使用说明三合一打包,任何能跑命令的环境都能用,不需要新协议、不用单独适配模型。
不是命令行复古了,是 AI 需要 CLI。人继续用 GUI,AI 在背后用 CLI,这才是 AI 时代真正的分工。
