众力资讯网

空间推理基准测试 SpatialBench 更新了最新一期榜单,阿里千问的视觉理

空间推理基准测试 SpatialBench 更新了最新一期榜单,阿里千问的视觉理解模型 Qwen3-VL、Qwen2.5-VL 位列头两名,超越 Gemini 3、GPT-5.1、Claude Sonnet4.5 等国际顶尖模型SpatialBench 榜单显示,Qwen3-VL-235B 和Qwen2.5-VL-72B 分别斩获 13.5 和 12.9 分,领先于 Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5 等海外顶尖模型