关于Deepseek,围观的人看热闹,用的人看门道。他的蒸馏能力到底有多强,R1

丁奉看科技 2025-01-30 19:30:13

关于Deepseek,围观的人看热闹,用的人看门道。他的蒸馏能力到底有多强,R1模型能力到底有多惊艳,恐怕不是一两个问题回答能够穷尽的。

关于 R1 的数据冷启动和多阶段训练的方法。使用强化学习算法实现的模型自适应训练和自我进化过程。破站upZOMI酱做了深度解读,评论区还附带了免费开源 PPT 教程。需要的自取! deepseek   

0 阅读:0
丁奉看科技

丁奉看科技

感谢大家的关注