前阵子,一个在集团公司做行政的朋友,跟我吐槽了一件事。
年初的时候,她们公司搞了一轮数字化升级,上了好几个AI工具,领导希望可以让AI真正融入日常办公。
但几个月过去,员工用AI最多的场景还是文案和翻译类工作,像自动审批、录数据、生成报表这类工作,基本都没跑通。
也是基于她提到的这个问题,我最近开始关注一类叫GUI Agent的产品。
这类Agent不只是跟你聊天,而是可以真的去替你操作电脑界面,点鼠标、打字、切换窗口、填表格,类似bit-Agent这样的产品。
今天重点想来跟大家聊一下,企业内部真正需要的,为什么是GUI Agent?
1
像我开头提到的bit-Agent,就是九科信息做的一款GUI Agent。
九科信息这家公司可能很多人没听过,但如果你在企业自动化这个圈子里,应该会对它比较熟悉。这家公司孵化自招商局集团,在大型企业客户里口碑不错的。
和大多数AI工具不一样的是,bit-Agent的核心能力不只是生成文本,而是操作界面。
比如,我们以招聘面试场景为例。
我可以直接上传一份简历,然后给bit-Agent下达一条指令:帮我分析这份简历,然后去智联招聘上找市场营销相关的岗位,最后把结果做成一个网页报告发到我邮箱。
它首先打开了智联招聘的网页端,根据简历里写的求职意向,开始搜市场营销相关的岗位。
搜到结果之后,它把页面上的岗位信息一条条记下来,跟简历做匹配筛选。
中间有个细节,因为简历上写的是没有正式工作经验,于是bit-Agent主动调整了筛选条件,选择了无经验要求的岗位选项。
最后它筛出了五个最合适的岗位之后,便自主地开始做分析网站,做完之后直接把结果发到了我邮箱。
结果里有简历概览、和岗位的匹配度分析、待提升的地方、面试建议,还有五个岗位的直达链接。 在bit-Agent里,文字、语音、图片、文档都可以作为输入,支持Windows、Mac、Linux系统,浏览器和本地软件都可以操作。
2
再比如,你是做达人运营的,领导在下班前甩来一句:今天之内把达人清单录入系统,顺便给符合条件的达人发邀约邮件。
如果是以前,还需要手动做。
但现在,你可以直接一句话丢给bit-Agent,给它发一条消息,大概说一下要做什么,电脑那边就开始自己动了。
bit-Agent首先会读取了桌面上的达人名单文件。
然后打开营销管理系统,进入达人管理模块,开始逐个识别字段、填写信息。整个过程你不需要提前教它哪个字段对应哪个位置,它自己看着界面就能搞定。
录入完成之后,它给筛选出来的达人一个个发了邀约邮件,每封邮件的内容是根据每个达人的情况定制的。
发完邮件之后,它还记得回到系统里把那些已发送邀约的达人状态更新掉。
但让我觉得有意思的,是接下来这一步。
做完这整套任务之后,bit-Agent会问你要不要把这个流程保存成一个"能力"。
你点一下确认,它就把刚才的操作固化下来了。
保存的时候你可以编辑每个步骤,它还会自动帮你总结这个能力是干嘛的、怎么用,而且,步骤还有动态/固定双步骤模式。
下次有新的达人名单,你直接调用这个能力就行,不用再重新描述一遍任务。
3
当然,上面说的招聘和达人运营,算是个人或者小团队就能用起来的场景。
但bit-Agent在大型企业里的表现如何呢?
毕竟那种环境对稳定性和安全性的要求完全是另一个级别。
有一个案例让我印象比较深,有一家大型车企,旗下上百家子公司,安全产品种类多、版本多。
以前用传统RPA方案做这件事,光搭建巡检模板就需要30人/天的投入,因为每个产品的界面都不一样,每个都要单独写脚本。
但用bit-Agent之后,只需要开发一套通用模板,1人/天就搞定了。
还有一个集团的差旅对账项目,每个月10万条单据,19份不同供应商的账单,财务人员要花10个完整工作日来处理。
引入bit-Agent之后,处理周期缩短了一半以上,错误率从原来的水平降到了0.1%以下。
这些案例有一个共同点:用AI解决那些人力成本高、重复性强、容错率低的硬需求。
4
但我更关心的是另一个问题:在公司内网能不能用?
这是很多企业用户最头疼的事。
市面上大部分AI工具都依赖云端和公网,但稍微大一点的企业,特别是金融、能源、政务这些行业,内部系统基本都在封闭网络里。
但bit-Agent在这一点上做了针对性设计。
首先,它支持私有化部署,信创生态也做了全面适配,统信、麒麟、鲲鹏、飞腾那些国产系统都能跑,断网环境下也能用。
另外在安全管控上,它做了细粒度的权限控制,执行过程全程可视,随时可以人工介入。
碰到高风险操作,比如涉及财务数据或者要删除什么东西,会自动暂停让你二次确认。
模型再聪明,如果只是停留在对话框里,对大部分打工人的日常来说帮助是有限的。
你真正需要的,或许是一个能替你去点鼠标、填表格、跑流程的AI。
而bit-Agent走的就是这条路。








