找到了一项现在视觉大模型还不擅长的工作:看表。ClockBench这个测试是让大

蚁工厂 2025-09-07 16:43:14

找到了一项现在视觉大模型还不擅长的工作:看表。

ClockBench这个测试是让大模型看表回答现在几点了(图1这种各种各样的表盘),基本上是全军覆没。图2最上面的黄色是人类成绩。 ​​​

0 阅读:1
蚁工厂

蚁工厂

感谢大家的关注