【小米罗福莉:Fable 5只是阶段性成果,世界模型仍处早期】#AI世界模型仍处早期阶段# 6月12日,在第8届北京智源大会全体大会的一场圆桌环节中,北京智源人工智能研究院院长王仲远主持了《重构世界——中国大模型巅峰对话》。
小米集团MiMo大模型团队负责人罗福莉,清华大学人工智能研究院副院长、生数科技创始人朱军,清华大学计算机系教授、面壁智能联合创始人兼首席科学家刘知远,南洋理工大学校长讲席教授、人工智能交叉研究院院长安波同台,围绕Claude Fable 5、AI Coding、AI自进化、智能体与世界模型等话题展开了近50分钟讨论。
这也是小米大模型发布会后,罗福莉再次出现在公开AI对话场合。
相比上一次围绕小米MiMo的发布与技术路线阐释,这一次她的发言更聚焦于大模型能力边界本身:Fable 5为什么强,Scaling是否仍然有效,AI自进化离“提出假设”还有多远,以及语言模型与世界模型哪条路径会更快落地。
罗福莉这次亮相,也正赶上小米AI动作密集释放。
就在本周,小米MiMo AI团队正式开源终端原生AI编程助手MiMo Code V0.1.0。这款工具面向长周期、多步骤编程任务,内置限时免费的MiMo-V2.5模型访问权限,并支持接入DeepSeek、Kimi、GLM等第三方模型。
它的一个核心卖点,是通过项目记忆、会话检查点、任务进度日志等机制,解决AI编程助手在长会话中容易丢失早期决策和上下文的问题。
更早之前,小米围绕MiMo-V2.5系列模型已经进行过一轮开发者侧动作。小米4月下旬开启MiMo-V2.5系列大模型公测,MiMo-V2.5-Pro重点面向Agent、复杂软件工程和长程任务等场景;随后,小米又推进API降价、Token Plan调整和“100万亿Token免费计划”,试图让MiMo更快进入开发者真实调用场景。
这也让罗福莉今天谈Fable 5、AI Coding和Agent时,多了一层现实背景:小米自己也正在把MiMo推向代码、长程任务、Agent和开发者生态。
面对近期引发行业热议的Claude Fable 5,罗福莉给出的判断相当冷静。她认为,Fable 5目前展现出来的能力,本质上仍然是Scaling持续推进后的自然结果,是大模型发展过程中的阶段性成果,而不是一个终点式模型。
她把Fable 5的能力提升拆成了三个维度。
第一,是预训练规模的继续扩大。罗福莉判断,Fable 5的参数量级可能已经达到当前最强开源模型的数倍,这意味着它仍然在延续参数规模扩张带来的能力提升。
第二,是test-time scaling与强化学习的持续加码。她认为,Fable 5在推理时扩展或强化学习上,应当也投入了相当大的算力资源。这让模型能力不只来自训练阶段,也来自推理、规划和复杂任务处理阶段的持续放大。
第三,是训练数据形态正在变化。随着大模型从Chat迈向Agent,训练数据也开始从自然互联网文本,走向人与Agent共同生成的新阶段。过去可获得的互联网文本token可能在40T到80T范围内,而Agent交互和合成数据正在把训练数据推向新的量级。
因此,罗福莉认为,Fable 5是预训练规模、Agent合成数据、test-time scaling与强化学习共同外延后的“大模型中间产物”。当王仲远追问她是否认为它依然是一个中间模型时,她给出了肯定回答。
围绕模型能力是否仍在快速增长,罗福莉也没有简单归结为线性或指数曲线。
她表示,模型能力通常是一个涌现过程,很难用一条固定曲线去量化。今天顶级模型的能力跃迁,并不只是按固定斜率向上爬升,而是在数据、规模、训练方法和应用场景叠加到一定程度后,在某些任务上突然显现新的边界。
这也是她这次发言里最值得关注的底层判断:Fable 5很强,但它仍处在大模型既有技术路线继续外延的过程中。它不是终局,而是下一阶段竞争的起点。
除了Fable 5,罗福莉开场就提到,自己近期最关注的方向是self improvement,尤其是在auto research领域。
在谈到AI自进化时,她进一步解释,上一代顶尖模型的核心能力,更多是在指令清晰的场景下完成高精度执行;而今天,顶尖模型的能力已经从单纯执行,延伸到抽象问题解决层面。
