AI 很聪明,但很无力现在的 AI Agent 推理能力很强,但在操控真实专业软件这件事上,真的很拉胯。
要么是这样:
> GUI 自动化 — 截图、点像素,脆弱得像个纸糊的机器人。今天能跑,明天软件弹个对话框就挂了。
要么是这样:
> 阉割版 API — 官方 API 只覆盖 10% 的功能,剩下的 90% 你想都别想。
要么是这样:
> 玩具级实现 — 重新写一个「简化版软件」,功能砍得七零八落,然后告诉你「这是 AI 友好的」。
就……很难用。
---
那怎么办?来自港大 HKUDS 实验室的 CLI-Anything 给了个很聪明的解法:
把任何专业软件变成 Agent 的原生工具,功能一个不少。
怎么做到的?
很简单 —— 一行命令:
/cli-anything:cli-anything ./gimp它会全自动跑完 7 个阶段:
分析 — 扫描源码,把 GUI 操作映射到 API设计 — 规划命令分组、状态模型实现 — 构建 Click CLI + REPL + JSON 输出测试 — 单元测试 + 端到端测试(真实软件验证)文档 — 自动生成完整文档发布 — 打包成 pip 可安装的包然后你就得到了一个:
# 随手安装到 PATH
pip install -e .
# 随意调用
cli-anything-gimp project new --width 1920 --height 1080
cli-anything-gimp layer add -n "背景" --color "#1a1a2e"
cli-anything-gimp --json export render poster.png不是截图,不是点像素,是直接调用真实软件后端。
---
硬核数据说话目前已经在 11 款主流软件 上验证通过:
| 软件 | 用途 | 测试数 |
|------|------|--------|
| GIMP | 图像编辑 | 107 |
| Blender | 3D 建模 | 208 |
| ✏️ Inkscape | 矢量图形 | 202 |
| Audacity | 音频制作 | 161 |
| LibreOffice | 办公套件 | 158 |
| OBS Studio | 直播录制 | 153 |
| Shotcut | 视频剪辑 | 154 |
| Zoom | 视频会议 | 22 |
| Draw.io | 图表绘制 | 138 |
总计:1,508 项测试,100% 通过。
每个 CLI 都是真实后端验证 —— LibreOffice 生成真实 PDF,Blender 渲染真实 PNG,OBS Studio 操作真实场景。
---
核心特点1. 零妥协的集成方式
直接对接真实软件后端 —— Blender 的 bpy API、LibreOffice 的 headless 模式、GIMP 的 Script-Fu。后端缺失?测试直接失败,不跳过,不糊弄。
2. Agent 原生设计
每个命令内置 `--json` 参数,输出结构化数据供 Agent 直接消费。不需要解析截图,不需要正则匹配,直接拿 JSON 用。
3. 有状态的 REPL
进入交互模式后,Agent 可以像跟人类对话一样操作软件 —— 创建项目、添加元素、撤销重做、导出结果。
4. 统一的使用体验
所有生成的 CLI 共享同一个 REPL 界面(叫 ReplSkin),品牌横幅、风格化提示符、命令历史、进度指示器 —— 全都一样。
5. 覆盖全流程
从代码分析 → 架构设计 → 实现 → 测试 → 文档 → 发布,全自动,一条命令全搞定。
---
支持的平台目前已支持:
Claude Code — 官方插件市场,安装即用OpenClaw — 原生 SKILL.mdOpenCode — 5 个斜杠命令Codex — skill 接入Qodercli — 插件支持更多平台正在接入:Cursor、Windsurf……
---
什么时候用场景 1:专业软件 Agent 操控
> "帮我用 Blender 渲染一个 3D 产品展示图"
> "用 GIMP 把这批照片统一调色"
场景 2:复杂工作流自动化
> "用 LibreOffice 生成 100 份定制化 PDF 报告"
场景 3:替代 GUI 自动化
> 受够了 RPA 的脆弱性?试试这个。
场景 4:快速构建 Agent 工具集
> 把你的内部工具/开源项目喂给它,一键生成 Agent 可用的 CLI。
---
快速上手第一步:添加 Claude Code 插件市场
/cli-anything:cli-anything ./gimp第二步:安装插件
/plugin install cli-anything第三步:开搞
/cli-anything:cli-anything ./gimp5 分钟后,你就有了一个完整的 GIMP CLI。
---
项目信息GitHub: https://github.com/HKUDS/CLI-AnythingCLI-Hub: https://hkuds.github.io/CLI-Anything/hub/Star: 2.1k+ ⭐---
总结CLI-Anything 解决的是一个很实在的问题:
> AI Agent 很聪明,但手很短,够不着专业软件。
它用一条命令,把这个差距填平了。
不是玩具,不是 demo,是真正能跑在生产环境里的工具。
今天的软件为人而生,明天的用户是 Agent。
如果你在搞 AI Agent 相关的东西,这个项目值得试试。
一行命令,让任何软件变成 AI Agent 的原生工具
AI 很聪明,但很无力现在的 AI Agent 推理能力很强,但在操控真实专业软件这件事上,真的很拉胯。
要么是这样:
阅读:3
点赞:0