众力资讯网

空间推理基准测试 SpatialBench 更新了最新一期榜单，阿里千问的视觉理

2025-11-28 17:30:44 挪威的森搞笑

空间推理基准测试 SpatialBench 更新了最新一期榜单，阿里千问的视觉理解模型 Qwen3-VL、Qwen2.5-VL 位列头两名，超越 Gemini 3、GPT-5.1、Claude Sonnet4.5 等国际顶尖模型SpatialBench 榜单显示，Qwen3-VL-235B 和Qwen2.5-VL-72B 分别斩获 13.5 和 12.9 分，领先于 Gemini 3.0 Pro Preview（9.6）、GPT-5.1（7.5）、Claude Sonnet 4.5 等海外顶尖模型

阅读：3 点赞：0

空间推理基准测试 SpatialBench 更新了最新一期榜单，阿里千问的视觉理

热门分类