OpenING:涵盖 56 个真实场景、5400+ 高质量人工标注样本的开放式图文交互生成综合评测基准。助力多模态生成技术飞跃发展!
- 📊 覆盖旅行指南、设计、头脑风暴等多样日常场景
- 🤖 全新评测模型 IntJudge 发布,评判准确率高达 82.42%,超越 GPT 评测 11.34%
- 🏆 提供详细模型胜率排行榜,支持人类、GPT-4o 和 IntJudge 多维度比较
- 🛠️ 开源评测代码与数据,助力快速上手和深入研究
- 🌐 多模态生成方法的性能和潜力一目了然,推动通用多模态智能发展
立即访问 GitHub 仓库,开启你的多模态生成评测之旅!
github.com/LanceZPF/OpenING