电影界图灵测试来了VLM电影理解新基准视觉语言模型（VLMs）虽能“看图”，但对

量子位看科技 2025-07-16 12:43:09

电影界图灵测试来了VLM电影理解新基准

视觉语言模型（VLMs）虽能“看图”，但对电影镜头还远远不够“懂”。现在，一个专为“电影感”打造的新基准来了。

由上海AI实验室联合NTU、同济和港中文推出的ShotBench项目，系统性地为AI模型测电影镜头语言能力打分，并配套推出模型ShotVL和训练集ShotQA，填补了该领域的评测、训练空白。

ShotBench是个专门考电影摄影语言的多维基准，收录来自200多部奥斯卡级别电影的3.5k高质量问答样本，涵盖8个维度：景别、构图、角度、焦段、照明类型与条件、构图方式和相机运动。每个问答都像是AI的“镜头语言理解测试”。

ShotQA是一个包含约7万个电影问答对的大规模多模态数据集。借助ShotQA，团队通过监督微调（SFT）和群体相对策略优化（GRPO）开发了ShotVL。ShotVL在ShotBench上显著优于所有现有的开源和专有模型，确立了新的顶尖性能。

团队在ShotBench上对24个领先的VLMs进行的评测揭示了现有模型的重大局限性：即使是表现最好的模型，平均准确率也低于60%，尤其是在处理细粒度视觉线索和复杂空间推理方面表现不佳。

与原始Qwen2.5-VL-3B相比，ShotVL-3B在所有ShotBench维度上均实现了持续且显著的提升（增益达19.0%），确立了新的顶尖性能，并明确超越了最佳开源模型（Qwen2.5-VL-72B-Instruct）和专有模型（GPT-4o）。

团队开源了其模型、数据和代码，以促进AI驱动的电影理解和生成这一关键领域快速发展。

一起来看详细内容：

0 阅读：1

量子位看科技

感谢大家的关注

作者最新文章

1

腾讯混元用130亿参数达千亿级效果腾讯HunyuanA13B性价比拉满腾讯混元推

2

AI也有味觉了用石墨烯舌头分辨咖啡可乐AI现在有味觉了！近日，科学家研发出一种人

3

智源发力具身智能领域从单机智能迈向群体智能具身智能大脑+全球首个具身智能SaaS

4

AI设计蛋白质饿死细菌新型蛋白质给细菌断粮抗生素日益泛滥的今天，AI正在给出一个

5

肥胖竟与周边餐厅有关肥胖竟受周边餐厅影响研究表明，肥胖与周边餐厅能吃到啥有关。麻

6

OpenAI首个开源模型再延期OpenAI开源模型因安全测试延期OpenAI的首

7

小扎挖人收购两不误Meta收购语音初创公司PlayAIMeta继续“买买买”！超

8

麦当劳泄露六千万人简历麦当劳密码竟是123456一串“123456”的密码，让麦

9

【马斯克公司组团升级】SpaceX向xAI输血20亿美元马斯克公司上演“组团升级

10

GPT5基准测试分数泄露GPT5要来了吗GPT-5基准测试分数泄露，整体表现超前

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

2

臻版回归！荣耀太狠了，这次看来是不准备留情面了！荣耀接下来最重磅的机型毫无疑问

3

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

4

同事iphone13pro有几年了，说电池健康度只有70%了，一天到晚的就见他

5

以后不会再给女朋友买iPhone手机，并不是iPhone手机不好，而是她买了一大

6

华为Mate70全系列官方指导价价格调整，渠道价等我更新，过两天部分机型会有不小

7

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

8

荣耀畅玩70Plus发布6.77英寸720pLCD屏7000mAh+45w充

9

要买荣耀400Pro的人一定要听劝！后悔可就来不及了，如果只是当做备用机千万

10

你的手机用几年啦？哎，手机坏了，我的华为mate30黑屏两天

科技最新文章

1

华为老手机也能升级鸿蒙5.0了！今天晚上央视财经频道直播鸿蒙破局，余承东亲口坦

2

告诉你们一个扎心的事实[捂脸哭]你们可能都买错了！很多人只会盯着新品荣耀400P

3

卧槽，小米空调赢麻了！没把格力挤下去，没把美的挤下去，把海尔挤下去了！只有小米实

4

iPhone17ProMax曝料史上最大电池iPhone！大瓜来了，弃钛用全铝边

5

苹果正式入驻小红书微博尴不尴尬，天天给果子上热搜，结果苹果就是不入驻微博，入驻了

6

说好的首发呢？真是没想到，首个通过国家3C认证的骁龙8Elite2机型，既不是

7

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

8

很奇怪，我一直喜欢小屏手机，之前用过的华为Mate50，Mate50Pro，一

9

我手上这台荣耀X70是12G+512G的，上手几天了，算上之前帮亲戚看机时摸过的

10

一天内添置了两台华为手机，一个是给老公买的华为mate70，一台是给婆婆买的华为