一篇关于强化学习的综述论文 Reinforcement Learning: A Comprehensive Overview 《强化学习:全面综述》第二版
arxiv.org/pdf/2412.05265v2
本文由Google的科学家 Kevin P. Murphy 编写,全面介绍了强化学习(Reinforcement Learning, RL)的理论基础、方法、应用及其最新进展。文章从序贯决策制定的基本概念出发,详细介绍了值函数、策略梯度和基于模型的强化学习方法,并探讨了多智能体强化学习、大语言模型(LLM)与强化学习的结合等前沿领域。
AI创造营