[LG]《DoWhat?TeachingVision-Language-A

爱生活爱珂珂 2025-08-26 07:20:38

[LG]《Do What? Teaching Vision-Language-Action Models to Reject the Impossible》W Hsieh, E Hsieh, D Niu, T Darrell... [UC Berkeley] (2025)

“Do What?”项目提出了Instruct-Verify-and-Act (IVA)框架，显著提升视觉-语言-动作（VLA）模型在机器人任务中识别和应对“虚假前提”指令的能力。

• 关键挑战：传统VLA模型假设指令均可执行，忽视了指令中可能包含的环境中不存在的对象或条件（虚假前提），导致执行失败或错误反应。

• IVA框架创新：

– 检测指令中不符合实际的内容（虚假前提），

– 通过语言交互澄清或纠正指令，

– 基于视觉感知和动作规划提出合理替代方案或拒绝执行。

• 数据集策略：构建半合成、带有正误指令对的大规模数据集，涵盖“域内虚假前提”（环境中类似但不存在的对象）与“域外虚假前提”（明显不合理或不存在的对象），确保模型能应对多样复杂情境。

• 技术细节：基于LLARVA架构，冻结视觉和语言编码器，端到端微调自回归Transformer解码器，联合学习动作预测与虚假前提检测纠正。

• 实验成果：

– 虚假前提检测准确率提升97.56%，

– 虚假前提场景成功处理率提升50.78%，

– 标准任务执行性能保持稳定，无显著下降。

• 应用意义：机器人能在面对不可能完成的任务时，主动识别问题、生成自然语言反馈，提升人机交互安全性和有效性。

• 局限与未来方向：当前数据集基于模拟环境，指令较为简短且结构化，未来需扩展至更复杂环境、真实世界部署及多轮对话场景，提升纠正策略多样性和创造性。

这项工作推动了机器人从单纯执行转向理解用户意图和语境推理，开启了更自然且安全的人机协作新篇章。

详细研读👉 arxiv.org/abs/2508.16292

机器人视觉语言模型人工智能人机交互机器人控制

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

SparseLoCo：面向大规模语言模型（LLM）预训练的通信高效算法，革新了分

2

GPT-5在空间智能领域实现重大突破，但仍未完全达到人类水平：• 首次系统整合8

3

[CV]《Next Visual Granularity Generation》

4

[LG]《Depth-Breadth Synergy in RLVR: Unlo

5

[LG]《Numerical models outperform AI weat

6

[LG]《Virtuous Machines: Towards Artifici

7

早！[太阳] 早安

8

大语言模型（LLM）上下文长度的爆炸式增长，背后隐藏着哪些关键技术突破？• 发展

9

OptimalThinkingBench：评估大型语言模型的“过度思考”与“思考

10

谷歌首次发布大规模AI服务环境影响全测量框架，揭示了AI推理能耗、碳排放及水资源

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

2

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

3

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

4

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

5

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

6

想买手机的可以等等了，接下来几个月热闹了九月份开始到年底，这段时间是各个手机

7

小米澎湃OS3眼看小米澎湃的发布会要开了，这次升级最核心的就是手机系统，改动确实

8

追觅官宣造车任何一个有过造车经验的传统品牌推出一个新能源品牌我都能想得到，唯独

9

臻版回归！荣耀太狠了，这次看来是不准备留情面了！荣耀接下来最重磅的机型毫无疑问

10

李想称希望和产品分割开其实理想在产品方面已经是非常不错的了，狗蛋身边不少家庭首选

科技最新文章

1

不可思议！荣耀GT再度出现“捡漏神价”，1200多就能拿下搭载骁龙8Gen3的性

2

记者问：“中美AI差距到底有多大？”梁文峰毫不避讳一针见血地回答：“表面上中国A

3

16+512G版本选谁？荣耀GTPro和Magic7“掐架”啦🤼宝子们，

4

外媒疑惑不解：2nm芯片基本上没人买了！老实说，7纳米就够用了，还便宜，谁会去

5

iOS双版本推送将至！按照以往惯例推测，苹果将于北京时间9月10日

6

照着下图买大电池手机就不会错了。8300mAh的荣耀X70坐稳头把交椅！据小道

7

世界首富马斯克评价DeepSeek，再次语出惊人！他说：“在人类历史的大部分时间

8

一图看懂iPhone17ProMax升级，你会发现苹果这次是真的下血本了！

9

奉劝大家一句：千万不要被iPhone17Air的轻薄骗了！苹果用

10

荣耀Magic8系列发布在即，低于3000元的荣耀Magic7才是真香选择，而且