「暗涌」:这次MLA创新是如何发生的?听说idea最早来自一个年轻研究员的个人兴

赛宜看趣事 2025-02-02 15:14:53

「暗涌」:这次MLA创新是如何发生的?听说idea最早来自一个年轻研究员的个人兴趣?

梁文锋:在总结出Attention架构的一些主流变迁规律后,他突发奇想去设计一个替代方案。不过从想法到落地,中间是一个漫长的过程。我们为此组了一个team,花了几个月时间才跑通。

「暗涌」:这种发散性灵感的诞生和你们完全创新型组织的架构很有关系。幻方时代,你们就很少自上而下地指派目标或任务。但AGI这种充满不确定性的前沿探索,是否多了管理动作?

梁文锋:DeepSeek也全是自下而上。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个idea显示出潜力,我们也会自上而下地去调配资源。

「暗涌」:听说DeepSeek对于卡和人的调集非常灵活。

梁文锋:我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。

deep seek

这个有点美国创新互联网公司的味道了。

不管是英伟达还是谷歌等很多idea都是这么来的。

其实非常类似美国高中和大学的社团,你要是牛逼,你就去自己出去搞社团,搞志同道合者,号召更多的人加入,把事情给干成了。

干不成,大家也没有啥损失,起码努力过了。

自己给自己找事干的好处是,哪怕一天干15个小时,一周干7天,还没有加班费,也自己乐呵呵,不会埋怨,甚至还会有负罪感,浪费了公司这么多资源,要是啥事也没干成,真是对不起公司

如果是领导硬生生分摊下来的,麻痹的,天天累死累活,不知道能不能给算加班费?要是干不成,最后劈头盖脸一顿骂,原来的工作也落下了,烦死了

0 阅读:2
赛宜看趣事

赛宜看趣事

感谢大家的关注