大佬从Meta辞职后去了新成立的AI研究公司recursive,研究“递归自我改进 AI”。刚他们发布了阶段性成果:“迈向自动化 AI 研究的第一步”详细:www.recursive.com/articles/first-steps-toward-automated-ai-research“Recursive 发布了其自动化 AI 研究系统的一些早期成果,主要覆盖模型训练和 GPU kernel 优化 benchmark。
今天,我们发布 Recursive 自动化 AI 研究系统的早期结果。在三个 benchmark 上,这个系统都达到了当前最优水平:固定预算语言模型训练、小模型训练速度,以及 GPU kernel 优化。
这个系统会围绕一个目标指标自动完成研究循环:提出想法、实现方案、运行实验、验证结果,并根据已有结果选择下一轮实验。它可以长期并行运行多条研究线程,保留之前实验中有用的上下文,组合有前景的分支,并在确认性能提升前检查 reward hacking 和方差问题。它的设计目标是可扩展,并借鉴了开放式算法、递归自我改进 AI 等方向的思想。
我们选择的 benchmark 既有实际价值,也具有快速反馈特性。它们分别考察 AI 进步的三个关键杠杆:更好的训练算法、更快的训练速度、更高效的硬件使用。这些任务也适合自动化研究,因为它们有明确指标、相对较低的方差,并且 evaluator 可以加固以防止 reward hacking。
我们正在开源这些实验运行产生的 artifacts,方便其他人检查并在这些结果基础上继续构建。”AI创造营


