Deepseek为什么如此牛逼?
1.顶级背景。
团队居然只有140人,清北名校博士居多,大多是职场5年内的新人甚至实习生,有不少阿里达摩院的离职员工。
2.扁平文化。
相比于阿里等大厂职级制度,其组织架构完全不看重职级,灵活组队,哪怕是实习生也能够调动公司AI,算力芯片等资源。
3.算法创新。
除了采用蒸馏算法等技术外, 在FP8混合精度和多令牌预测等技术上有创新,还采用了MLA架构、“对偶流水线”机制等。
4.极致效率。
他们走出了完全不一样的道路,并不依赖于海量数据的投喂,而是通过总结和分类数据提升训练效率。
5.超级待遇。
很多人没有留意到他们的实习生居然日薪是上千元一天,要知道今天阿里等大厂每天的实习生待遇平均也只有200~300元。
总之,他们走出了和大厂完全不一样的模式,正如马云所言:相信小的伟大,敢于去大胆创新。
天园地方
AI图