Kimi产品做得好,没想到AIInfra也做挺好
细看甲子光年
2025-01-23 15:13:03
Kimi产品做得好,这是有共识的,但这次我们在拆技术报告时,意外地发现,他们在AI Infra方面也下了很多功夫。
这次也是Kimi技术团队第一次准备详细的技术报告,记录和分享新技术范式下的模型训练技术探索之路:《Kimi k1.5:借助大语言模型实现强化学习的 Scaling》。
RL(强化学习)可以让模型在“尝试—反馈—改进”的循环中不断提升。为了实现这个循环,就需要一个完整的训练系统来支撑。
本次Kimi的技术报告就分享了,如何在RL的模式下做AI Infra。(图2和图3)
大模型 AI AI Infra
0
阅读:0