众力资讯网

国产版Cowork来了?我用真实工作流测了一圈

文:王智远 | ID:Z201440百度出了个新东西,叫DuMate(中文名:搭子);属于「龙虾全家桶」里的产品,3月1

文:王智远 | ID:Z201440

百度出了个新东西,叫DuMate(中文名:搭子);属于「龙虾全家桶」里的产品,3月17号刚官宣,终于上线了。

说实话,一开始没抱太大期待;市面上AI助手已经不少了,海外有Claude的Cowork,国内各家也在做;多一个少一个,好像也没什么稀奇。

但装上用过之后,我自认为他可能是目前国内最接近、最容易让人上手的产品,甚至有些地方走得更远。比如:它能找文件、拆任务、搞不定的事还会自己敲代码解决。

关键是,能力可以跑在本地,数据不出电脑。它的企图心可能是通吃openClaw和cowork。

01

下载后,主界面它会让你设置一个工作区。说白了,指定一个文件夹,所有数据都存在你本地。

这里给大家一个实用建议:Windows用户最好单独挂一个盘;Mac用户建议独立建一个文件夹,干净利落。

进来之后有一套引导问题。比如:

试试帮你查一下文件、帮你把文件分个类、搜点AI新闻做成PPT。别小看这几个问题。现在很多人下载了这类产品,打开之后第一反应是懵的,因为不知道我要用它做什么?

咱们看看它能干什么活儿。我挑了三个场景。

第一个:视频总结。

做内容的人都有一个痛点,经常要看国外的行业视频,有些内容不好下载;我的土办法是去B站搜,很多博主会把Twitter或者其他渠道的内容搬运过来。

这次我找了一个A16z最近关于媒体发展趋势的解读视频,直接把链接甩给DuMate,让它帮我做个总结。

没抱什么希望。

因为这涉及到一个「生态墙」的问题。各平台之间都不愿意互相打通,你想从别人那里抓内容,往往很困难。

结果它的反应让我有点意外。

一开始,它提示浏览器代理无法获取内容。我心想,果然;但紧接着,它切换了一条路径;调出内置的Chrome浏览器,在后台把页面打开了,直接开始跑流程。

遇到障碍,自己想办法绕过去。

这一步就很有意思了,更让我没想到的还有下一步,它跑完视频内容之后,自己又打开了一个页面,去知乎搜了一圈关于A16Z商业模式的讨论。

这个动作完全不是我要求的。它自己判断「光看视频不够,我再补充点外部观点」。

你想想这意味着什么。你说一步它走一步,那是工具;你给它一个目标,它自己规划怎么走,这才是智能体。

整个流程跑了3分多钟;最后它直接给我生成了一份Markdown文档,存在本地,点开就能用。

总结的核心观点是:A16Z这家顶级风投,如何从传统的「闷声发大财」思维,转变成主动输出内容、建立公众影响力;核心判断是,在注意力稀缺的时代,持续公开输出价值,比保持神秘更有价值。

提炼得相当准。

3分钟,从视频理解到信息补充到文档生成,一条龙跑完。慢吗?不慢;跑这种真实任务就怕它快,快的东西不一定靠谱。大家都懂。

02

第二个场景,发票整理。

这个痛点不用多解释,打工人都懂;我每个月都要处理一大堆发票给财务,打车的、吃饭的,数量多到自己都记不清有没有重复下载。

这次直接把几十张发票一股脑上传上去,跟它说:

你能想象吗?我每个月都要不定时处理一大堆发票,你知道我的痛苦吗?你能不能帮我汇总一下,这里有多少张,一共多少钱?

还提了三个具体需求:

一,把重复的剔掉、二,给我一个总金额、三,给我一份汇总清单

接下来发生事情,是整个测试里最有意思的部分。它先跟我说了一句:抱歉,我没有直接整理PDF的技能。我心想,得,果然。但它话没说完,紧接着,它自己开始写脚本。

对,没错,它自己写了一段代码,安装了一个专门处理PDF的技能,开始提取所有发票里的数据。

我看着屏幕上它一顿操作,说实话有些步骤我也看不太懂。但能明显感觉到它在调用Skills、写prompt、跑任务,一套组合拳打下来非常流畅。

更有意思的是执行过程。

跑着跑着,它发现有几张发票的格式不太标准,提取数据出了偏差;然后它会回过头去检查哪一步出了问题,调整策略,换一种方式重新提取。

你用过其他AI工具就知道,以前的工具,卡住就是卡住了,等你给它新指令,这个不一样,自己能扛住压力往下走。

最终结论:一共46个文档,发现2张重复发票,去重之后算出了总金额。

我不太放心,又用MiniMax 2.5跑了一遍做交叉验证,结果一模一样,数据是准的。

处理完之后,它还多做了几件事;按类型罗列了一份分类清单,把所有数据写成了一个JSON文件,然后主动问我:需要把重复的删掉吗?

注意,它是等我确认才操作的。

后来让它出一份汇总表格方便发财务,表头什么的让它自己规划,也直接搞定了;最后我又追加了一步:发票都整理好了,帮我把文件归到桌面的指定文件夹里。

它直接就去干了,找到文件、移动、归类,一气呵成,整个流程从提需求到全部完成,大概3分钟。

两个场景跑下来,你会发现一个规律:

它每次遇到「做不到」的事情,是自己想办法绕过去;视频那次用Chromium绕过生态墙,发票这次自己写脚本弥补缺失的技能;两次了,这是一种稳定的行为逻辑。

03

第三个场景,记忆;我想试试,它懂不懂我。

每个人写东西都有自己的风格习惯;我把前两天在公众号发的两篇文章链接甩给它,一篇关于软件,一篇关于智能中枢,让它分析我的写作风格。

这里有个细节。

文章比较长,复制粘贴挺麻烦的,我更倾向于直接甩链接;但问题是,微信公众号的文章,外部工具想读取链接内容,通常读不了。

我偏想试试,果然,一上来就提示浏览器代理无法获取内容。

熟悉的配方,但接下来也是熟悉的操作;它又调出了内置浏览器,在后台打开链接,把内容读了出来。

到这里,同样的行为模式已经出现第三次了。

视频总结遇到B站的墙,它绕过去了;发票处理遇到技能缺失,它自己造工具;现在读公众号链接又被挡了,它还是自己找到了路。

三次了。

读完文章之后,不到一分钟,风格分析就出来了,它抓到了几个核心特征:对话感强、口语化表达、观点不端着。

说实话,分析得挺准的。基本上把我写东西的调调给摸到了。

但这还不是最让我惊喜的部分;第二步,我跟它说:你帮我把这个风格分析做成一个Skill吧,我下次还要用,它真就给我写了一个Skill出来。

保存在本地文件夹里,还贴心地给了调用示例,类似于「把这段话用智远的风格改一下」。

你想想这意味着什么,它是把分析变成了一个可以反复调用的能力,存在我电脑上,随时能用;从「一次性服务」变成了「长期记忆」。

第三步,才是真正的考验。

我关掉当前对话,重新开了一个全新的对话框;什么风格要求都没提,直接跟它说:你还记得之前我让你跑的那个A16Z视频总结吗?用我的写作风格,帮我把那个总结改写一下。

它开始找文件,一开始没找到,显示目录是空的;我心想,完了,记忆断了,但它没放弃,自己又找了一圈。

大概20秒,找到了,然后调用了我之前让它做的那个风格Skill,它自己还说了句「太好了」,就开始改写。

改完之后,我认真看了一遍;怎么说呢,风格还原度大概八成。

对话感有了,短段落有了,整体读起来确实像我写的东西。但有些地方还是差那么一点,有些需要主观判断的表达,它拿捏不了。那种东西靠的是经验和感觉。

不过话说回来,八成还原度,日常工作中已经完全够用了,我自己过一遍,删删改改几处就能直接发,最后我跟它说,旧版的总结文件可以删了。

它又问我:确定要删吗?我点了确认,它才动手,三个场景到这里就跑完了。很稳。

04

说完三个场景,聊聊这个产品本身。

DuMate目前内置不少Skills;搜索、作图、文献、邮件、视频处理,常用都有,基本是百度自家的强项全线铺开,开箱即用。

你也可以自行安装扩展,从GitHub、CloudHub都能装。

对普通用户来说,去GitHub下载Skills这个动作门槛不低;不过,我在测试中发现了一个更有意思的路径,你可以直接让它帮你装。

换句话说,它不只是一个用技能的工具,还是一个能自己造技能的平台,这个开放性,跟单纯堆功能数量是两回事。

跑完三个场景之后,这两天它又帮了我一个忙。

我日常用Obsidian做笔记。

每次新建笔记都有一个固定模板,模板里会自动同步当天的日期,用了很久一直没问题,结果那天突然不显示了,这种事最烦人,卡在那里就是没法正常用。

我先让豆包带着我修,折腾了一圈,没搞定;后来想起来DuMate还开着,就顺手甩给它:你帮我检查一下,我Obsidian模板库里有个笔记模板,日期不显示了,能帮我解决吗?

它真去搜了,搜完之后一步一步带着我排查,最后把问题解决了,说实话,这个场景才是最接近「日常搭档」的状态。

前面三个测试,多少带着点考试的心态,我主动出题;这一次不一样,是工作中突然碰到一个问题,顺手丢过去,它接住了。

顺便提一个小细节:

之前第三个场景里,我让它把写作风格做成了Skill,它会自动生成一个名字;如果你对名字不满意,直接跟它说「帮我改个名」,它也能改。

这些东西单独看都是小事,加在一起,就是「越用越顺手」的感觉。

再说说安全。

测试过程中有一个细节反复出现:每次涉及删除文件,它都会停下来问我确认。

这个体验背后有一整套设计。

据我了解,DuMate预装了安全沙箱,跟本机环境是隔离的;代码和任务全部在沙箱里闭环执行,不扩散风险、不泄露数据;你日常用时可能感知不强,但它决定了一个关键问题:你敢不敢真的把工作交给它。

一个桌面AI助手,如果安全上让人不放心,功能再强也白搭。

最后聊几句行业的事。

海外的Claude Cowork今年1月发布,DuMate 3月跟上,同一个品类,中美几乎同步起跑,两边长出来的东西很不一样。

Cowork的基因是开发者工具;它脱胎于Claude Code,本质上是把程序员在终端里用的AI能力,包了一层图形界面给非技术用户用。

底层逻辑是代码驱动的,擅长文件批处理、自动化脚本这些偏技术向的任务。目前Mac优先,英文生态,插件体系也偏开发者思维。

DuMate走的是另一条路。

它是从百度自己的搜索、百科、文心大模型这套内容生态里长出来的,所以它天然更懂中文语境下的信息处理。

搜一个知乎观点、读一篇公众号文章、理解一张中文发票,这些事情对它来说是主场作战,再加上OpenClaw的Skills生态和双端覆盖,它就是为了帮每个打工人提效。

说白了,Cowork解决技术人怎么把AI用得更深;DuMate解决普通人怎么让AI帮我干活,出发点不一样,终局也不会一样。

而且这个赛道才刚开始,两个月的差距几乎可以忽略不计。

我的判断是,2026年会是桌面AI助手真正的元年;当AI走到你的桌面上,能读文件、调工具、搞不定的事还会自己想办法,它就不是一个对话框了。

四个场景跑下来,DuMate还有毛边,但方向对了;这,才是真正的开始。

以上为真实使用情况,好用不吹嘘。