不知道各位对人工智能AI的认知是什么?
是重新赋予传统智能音箱AI功能,但是依旧和传统智能音箱没拉开太大差距?
还是AI文生图,文生视频,但是依旧偏向娱乐性质?
亦或是电脑上具备些生产力的AI实时翻译这类工具?
从实用角度来看,AI变得越来越有用,无论是Deepssek还是chatGPT,它都方方面面贯穿了生活和工作,这才是人类研究AI的最终目的,让生活变得更美好,让工作变得更轻松。
专注于工作和商务的钉钉,最近推出了一AI办公小助理DingTalk A1硬件产品。

这是一款功能非常丰富的产品,它的一部分作用你可以理解一款智能AI录音笔和翻译机,但是远比录音笔和翻译机要强大的多。
它可以高效记录、转写、翻译(包含同声翻译以及实时翻译)、总结和分析语音沟通内容,和钉钉工作流程打通,无缝衔接工作。
比如会议场景的语音记录、总结、待办、重点事项、风险、AI建议等,如果这个会议是国际会议,这台钉钉A1也没问题,可以高效识别翻译内容并结合AI大模型做总结。
又比如学生和记者,前者上课录音,后者交流访谈,都可以归纳分析整理。
或者个人最简单的,看一些无字幕的纪录片或者学习资料,有了这台设备,可以同声传译,实时理解,帮你最快速度理解大概内容。

「型号」:DingTalk A1旗舰版
「尺寸」:91mm x 60mm x3.8mm
「重量」:40.8g
「处理器」:6nm AI音频处理芯片ES52800
「麦克风」:5颗全向麦克风+1颗骨传导麦克风
「拾音距离」:8米
「存储空间」:64G内置+10G云存储
「屏幕」:0.95英寸彩色屏幕
「电池容量」:660mAH
「待机时间」:60天
「连续录音时间」:45小时
「语种翻译服务种类」:21种语言同声传译/8种语言实时翻译
朴实无华的外观

DingTalk A1包装非常小巧,单手就可以握持,内部涵盖了说明书、本体、磁吸圆环,本体是带皮套的,DingTalk A1有五种颜色,当你把它吸附在iPhone背后,很像卡包,厚度也差不多。

老实说,这么小的一个设备我是真没想到的,收到之前我以为会有手机那么大,但是它没有设计大屏幕,所以体积可以做的相对小巧,毕竟一个需要经常带出去的设备,做大了也很难崩。

iPhone本身具备magesafe,所以DingTalk A1的卡包可以直接吸附在iPhone背后,部分安卓手机可以使用配件中磁吸圆环达到相同的效果。


卡包皮套和主体可以分开,你要是用腻了一种颜色皮套,可以更换其他颜色换换口味。

本体重量40.8g,连带皮套一共69g,对于手机来说增加的重量不算多。


给人的感觉就是几张信用卡叠起来,非常小巧轻便,本体为金属材质,正面为产品型号和一些基本信息,背面设计类似手机。

旗舰版DingTalk A1显示区域有两颗实体按键,中间为0.95英寸显示屏,主要显示一些简单的信息,比如录音提示、聆听钉钉消息等。
右侧两颗实体按键是旗舰版标配的,青春版少了一颗语音按键。

左侧按键主要是负责开关机、录音开始/暂停,右侧语音键除了发送语音,另一个作用是开启屏幕。

厚度方面仅比两张SD卡叠加一起要薄一点点。

机身上一共提供了6个麦克风孔,包括5颗全向麦克风+1颗骨传导麦克风,均匀分布在四周,皮套上也配合开了相应的孔洞,底部唯一接口就是充电C口。

如果你的手机壳本身就带了磁环,那么可以直接吸附贴合使用。

握持在手中没什么特别感觉,甚至比苹果自家的magesafe卡包还要轻薄。
录音+AI全栈功能表现符合办公生产力吗?
作为录音工具,DingTalk A1可以独立于APP之外录音运行,录音结束后可以同步到钉钉中,本身64G存储空间就可以留存很多内容,实际上由于录音文件体积较小,日常使用不会感觉到空间局促,毕竟就算64G空间满了,还有10G云空间可以应急。

录音按钮自带了一颗指示灯,亮起来就是录音中。

录制完成后,如果设备连接上了手机,会自动进行同步,如果没连上手机会保存在机内空间内,等连接上后手动同步。

所有功能都是基于录音实现,作为基本的录音设备,它的音质表现尚可。当你把录音文件上传到钉钉APP中,就可以实现生产力大爆炸。

它的原理也并不复杂,当你开始以固定场景,比如客服电话、会议、访谈、汇报这类模板将转写的录音生成纪要,它会调取AI模型进行生成,这个时间大概会花费几分钟。

同时如果纪要中出现关键词,比如“会议”、“客服拜访”、“培训”、“项目”,不同类型的AI小助理会激活,给出相当完善的分析。
纪要依赖的AI大模型主要是五种,包括通义千问Qwen-plus和QwQ-plus;DeepSeek-R1 qwen32b蒸馏版和671b满血版,以及DeepSeek-V3 671b满血版。
通义千问Qwen-plus适合通用性摘要,尤其是兼顾中英文混合内容或者多语言支持。通义千问QwQ-plus面向学术研究辅助场景,高校论文、实验数据因果推理,高复杂任务更适合。

DeepSeek-R1 qwen32b蒸馏版灵活性比较高,短文本、实时性要求较高的可以选择它。
DeepSeek-R1 671b满血版强化了推理逻辑能力,长文本结构化,更适合科研、法律等场景。
DeepSeek-V3 671b满血版更适合中文,同样是高效长文本处理,适合生成复杂语境下的连贯摘要,或需要高精度中文事实提取的场景。
这些使用中都可以尝试,找出总结最好的那个版本,反正对于这台设备来说,只是多运行几分钟的小事。
中文发布会/英文发布会/访谈/会议/电话咨询场景表现
中文发布会
当一个长达2个小时18分钟的中文发布会录音,中间还夹杂着视频和一些英文场景,使用效果会如何?
我选了最近蔚来的ES8发布会,李斌确实很能说,我为了完整的体会DingTalk A1的功能,也是从头到尾看完了发布会。

李斌讲了很多东西,除了大篇幅讲述第三代ES8的优势,还穿插了不少其他内容,比如川藏线上换电站建造的艰辛历程,对于蔚来技术发展的回望。
DingTalk A1只花了三分钟,就将全部录音内容转写成功,场景我选择的日常记录,AI大模型是通义千问Qwen-plus。
这里稍微出了一点无关大雅的小错误,就是ES8被识别成了S8。


在其生成的纪要中,讲述川藏线上换电站的艰辛和技术发展回望并没有被归纳到其中,毕竟正常发布会的主角是ES8,这点我表现还是很满意的。
纪要总结的非常详细,超出了我的预期,基本上提炼出了发布会的核心内容,对于中文发布会的表现,我可以打五星。


AI会议小助理在这里被激活了,虽然这个发布会并不是会议,也不需要分析问题,但是我还是看了一眼,整体分析有板有眼,你们可以看一下,通义千问Qwen-plus结合DingTalk A1还是达到了该有的实用水平。
英文发布会
英文发布会选了一个短的,但是非常随性,2019年特斯拉老款model Y和model 3发布会,马斯克基本上想到什么说什么,不过他没有花费大量时间讲述model Y和model 3的性能优势,只是相对简单顺势介绍了一下,更多内容还是对于特斯拉发展历程的感慨和归纳,包括几大工厂的建立(尤其夸了上海超级工厂)、全球超充网络的发展。
相对于国内发布会言简意赅,没有那么多花里胡哨的东西。

这场发布会我也是全程看完,不依靠字幕我基本上看不太明白,毕竟马斯克语速较快,偶尔还有些结巴,相对于苹果CEO库克那标准慢速英语,完全是听不太懂。


依旧是日常记录场景和通义千问Qwen-plus,这次大概也差不多2分钟,看了一眼纪要,相对就简洁多了,基本上归纳了主要内容,很棒。
相对于李斌的ES8发布会,马斯克确实更像是一场个人会议,这次的AI会议小助理生成的分析就相对更合理,包括早期特斯拉如何快速起步,如何打破对于此前电动车的刻板印象。

后续跟进的也很合理,包括扩大特斯拉在中国市场的生产规模,自动驾驶功能软件的更新,加速太阳能屋顶和Powerwall的生产。


AI会议小助理对于这场会议总体评价是偏高的,言简意赅,情绪积极。
面对面访谈
访谈也是选择了一个总台记者的采访,采访对象是联合国人居署执行主任罗斯巴赫,整个采访均为英文,不看字幕我大概能听懂一些,但是通篇全部听懂基本不可能。

这个时候DingTalk A1就发挥了很大的作用。
这场访谈主要是两人,记者和罗斯巴赫,中间也有一些片段插入了其他人讲话, DingTalk A1识别为三人,整体还是很精准的。
这次我使用了采访笔记场景,通义千问Qwen-plus。
主持人识别为记者(发言人2),访谈中记者并未提及自己名字;而联合国人居署执行主任名字在访谈中提及了,所以DingTalk A1直接识别出来了,但是有一些小问题,识别出来为联合国副秘书长,不过这问题不大,英文翻译基本上都正确。


纪要中生成了多个表格,第一个表格描述了事实和观点,对于国内城市发展的经验、城市发展的理念情感倾向值评价均为积极评价,其中一些观点,比如中国经济对全球南方国家具有可复制性,比如城市发展理念与联合国“以人为本”的城市理念高度契合也符合访谈内容。
整合了“争议焦点”,描述了中国城市化带来的经济效应以及社会环境问题。

未明说的潜在信息很有意思,也基本上分析对了。

纪要还提供了后续采访建议方向,生成了代办事项,选择对应的代办事项就可以创建钉钉待办,这个主要针对于发言者2,也就是记者。
此次更新的章节较少,但是基本定位明确,标题总结到位。
各位要是感兴趣,可以搜一下总台的《高端访谈》20250718 专访联合国人居署执行主任罗斯巴赫。
会议
真正会议确实没办法录制和公开,所以我找了一个模拟的视频会议,当然它也是国外的,纯英文沟通,这次不仅没中文字幕,语速也是非常快的,我基本听不懂聊什么,全靠 DingTalk A1识别统计,这次使用了会议纪要场景,以及DeepSeek-V3 671b满血版AI大模型。

纪要首先做了省流总结,总结了会议内容和议题,确定了关键决策和行动事项。
会议时间、地点以及参会成员也做了表格统计。
接下来是会议议题、会议结论,并且提供了代办项,同样选择对应的代办事项就可以创建钉钉待办。
对于会议录音转译加整合分析为纪要,AI确实很高效,这点上来看,生产力是妥妥的。

另外会议还可以打开声纹识别功能,对于本人声纹会标识,使用上会更方便。
电话咨询
DingTalk A1六个麦克风中提供了一个骨传导,所以贴在手机上,手机不开外放,也可以录制很好的质量。
首先来说说通话录音,安卓用户无需多言,iPhone用户也是自带了通话录音,但是有时候你通话录音只是想确保自己不想遗忘通话内容,不想让对方知道正在录音(作为证据使用必须让对方知情), DingTalk A1磁吸在背后只需要长按录音键,就可以开始录制。
如果录制后上传到APP中,它同样可以生成纪要,不过我感觉这个功能更适合需要回访大客户的金牌销售,后台生成的纪要和AI客服/销售小助理能提供非常完整的分析表格。
我找了另一个前段时间非常有意思的客服通话记录,是大疆运动相机被土拨鼠抢走的语音通话记录,看看 DingTalk A1的分析。


整体分析有理有据,还提供了客户流失风险评估。
实时翻译/同声传译
实时翻译和同声传译功能类似于现在的翻译机,DingTalk A1提供了21种语言同声传译/8种语言实时翻译,足够应付几乎所有场景了。
这两个功能,后者更适合长时间不断的讲述场景,比如纪录片、国外发布会、外语视频等,属于单向翻译;前者更适合个人和断断续续沟通场景,同时是互译,比如日常出国沟通,但是这个功能它仅能显示文字信息,并不能读出来,希望后续OTA更新掉这个小小的缺陷。

实时翻译实测效果很好,延迟很低,说出来基本上很快就能翻译出来,8种语言主要是中⽂、粤语、英语、法语、德语、⽇语、韩语、俄语,基本涵盖了主流语言,同声传译除了前8种语言外,还提供了泰语、印尼语、⻄班⽛语、⻄班⽛(阿根廷)、⻄班⽛(墨⻄哥)、葡萄⽛语、葡萄⽛(巴⻄)、越南语、意⼤利语、阿拉伯语、波兰语、菲律宾语、⻢来语、印地语、瑞典语、芬兰语、捷克语、匈⽛利语一共21种。

同时传译表现也是不错,我用它来看一些外语视频,虽然翻译不是特别精准,但是大概能看懂意思,了解基本内容,它的延迟会稍微高一点,但是不会影响观看体验,但是我个人比较推荐录音后用学习笔记场景分析,会比直接通过实时翻译更合适。

但是看英文发布会确实不错,尤其是苹果公司CEO 库克这种类似标准慢速英语,吐字异常清晰的大佬,基本上可以做到完全精准的翻译。
其他功能

旗舰版的多了一个语音按键,可以在使用中吸附在手机后背,随时长按录制备忘录,录制完可以发送给钉钉内置的AI工具或者自己用作备忘录,不过这个功能需要打开钉钉APP,更多是作为工作顺手发个语音备忘录使用,你也可以提出一些需求,发给钉钉内置AI工具,比如安排代办事项,非常适合工作使用。

当然这个功能和手机的语音备忘录有些重复,但是就我个人而言,我并不想把生活中的备忘录和工作备忘录二合一,这个功能也算是比较实用。
这个语音功能,也可以用于同事回复,语音会自动转换成文字发出去,当然钉钉也具备这个功能,只是多了一种运用方式。
关于续航
续航是最不需要担心的事情,这两天高强度使用,电量依旧充沛,毕竟除了0.9英寸屏幕偶尔需要点亮外,它的耗电仅仅是蓝牙和录音,这两都是低功耗。
所以哪怕忘记关机, DingTalk A1依旧能续航很多天。
如何评价DingTalk A1?

作为AI时代兴起的工具,十年前我们是很难想象AI真的可以融入到生活和工作中,作为生产力工具发挥作用。
在我上初中的时候,我幻想过语音输入文字,那时候都是五笔输入,我背字根不太行,用的微软拼音效率很低。
而在多年前,语音输入文字且识别的效率就已经很高了。
AI的兴起,让录音这种古老的记录方式换发出青春,会议速记,你要做的只是开启录音,结束后等待2~3分钟,AI分析的比你本人做的还优秀。

无论是会议、电话会议、访谈、纪录片、课程、公开课,还是电话销售、客户服务、法律顾问、法律咨询、面试场景,只要能录音的,DingTalk A1都可以匹配上,30多个AI场景总结模板+4大AI大场景模型以及10+AI小助理,能做出细分的精准分析,极大程度提升工作和学习效率。
常见的语言也是通吃,可以实时翻译或者同声传译,延迟低,准确性还不错,日常旅游留学,外企中工作交流,商务差旅都可以带上这个小小的设备,能解决很多问题。
目前旗舰版售价是799,青春版499,这么一个小巧不占地的生产力辅助设备,你会考虑吗?