Hugging Face 团队发布的关于 Open R1 项目的第三期更新。
huggingface.co/blog/open-r1/update-3
主要进展是:
✨CodeForces-CoTs 的构建:一个包含近 10 万个高质量样本的数据集,从 R1 中提炼出 C++和 Python 的解决方案。
✨IOI 基准测试:2024 年国际信息学奥林匹克竞赛(IOI)中具有挑战性问题的新基准。
✨OlympicCoder:两个经过微调的 7B 和 32B 代码模型,在 IOI 问题上表现优于 Claude 3.7 Sonnet 等闭源前沿模型。
AI生活指南AI创造营