找到了一项现在视觉大模型还不擅长的工作:看表。
ClockBench这个测试是让大模型看表回答现在几点了(图1这种各种各样的表盘),基本上是全军覆没。图2最上面的黄色是人类成绩。
蚁工厂
感谢大家的关注
作者最新文章
热门分类
科技TOP
科技最新文章