微软最新研究，让AI学会预测自己的思维

大语言模型（LLM）虽然聪明，但往往“走一步看一步”，缺乏对未来的长远规划和深度思考。

微软研究院最近提出了一种名为 NextLat（后继隐状态预测）的全新训练方法。

他们发现，如果不仅让AI预测下一个字（传统做法），还逼着它提前预测自己听到下个字时“大脑会怎么想”，AI就能像人类一样，在脑海中建立起一个清晰、连贯的“世界模型”。

这种方法在处理熟悉的数据时可能效果很好，但在模型需要进行规划、绕路、推理或将隐藏结构向前传递时，就会失效。

NextLat 通过添加一个训练任务来解决这个问题：模型必须预测其下一个隐藏状态，而不仅仅是下一个词。

隐藏状态是模型对其所见内容的私有摘要，因此预测下一个隐藏状态可以促使模型学习情况随时间的变化。

作者在类似地图的世界建模、数学推理、图规划、故事预测和常规语言建模等任务上测试了 NextLat。

主要结果表明，NextLat 通常能够学习到更紧凑、更有用的内部状态，更好地解决规划任务，并将生成速度提升高达 3.3 倍。

总的来说，它赋予了 Transformer 模型一些循环模型的有用内存行为，而无需改变 Transformer 的架构或减慢正常的推理速度。

论文可以直接download哦~ 👇🏻 如果觉得我们的分享对你有用的话~ 👏🏻一键三连~

众力资讯网

微软最新研究，让AI学会预测自己的思维

热门分类