DeepSeek遭美国IP网攻暴力破解
DeepSeek将引发硅谷H1-B开发模式崩溃,让美国如临大敌
1. DeepSeek冲击波,是因为产品性能本身的震撼。很多美国人都用了,这是他们用过的最好的大模型。OpenAI的o1理论上和deepseek r1性能相当,但高级功能是需要200美元的年费,大多数人没用过。
2. 但是,更让硅谷震惊的是,它的开发费用极低。新闻一般说的是550万美元的训练费用,但这不是根本,算法优化是可能成本大降的,美国人自己也干过降本的事 。马斯克就把火箭发射成本降低了很多。硅谷聪明人看的更深的,是deepseek的开发团队,全是中国本土培养的年轻人,论文作者一个外国人都没有,100多人就干出了这么复杂的开发。
3. 相对的,硅谷是H1-B商业开发模式。美国自己培养的开发者不行了,硅谷公司用H1-B签证引入了全球人才。马斯克极力为这种模式辩护,他的企业全靠这种模式才做起来。一个有争议然而成立的观察是,H1-B员工比美国工程师水平高,最起码性价比明显高。
4. 硅谷相信斯大林的“数量也是品质”的论述,苏联靠武器数量打赢了二战。硅谷雇佣了庞大的技术人员团队,大公司的营收支持它们不断扩充技术人员数量。美国在IT研发上的领先让硅谷大公司相信,人多总会有用。如果美国本土开发人员不够,那就引入H1-B劳动力,大量印度研发人员因此来到了美国和硅谷。
5. 但是,现在竞争已经升级了。大量H1-B开发者,是不是真的实力强大,能做最好的开发?实践证明,一般性任务还行,一个人不行还有几十万个工程师。但是最高水平的大模型研发是另一回事,更大的团队是没有用的。
6. deepseek是精英开发模式,所有研发人员都是中国人,而且都是在中国环境中验证过的潜力很高的年轻天才。这些人还很有“自驱力”,对技术充满热情。相反,硅谷充满了社交媒体和AI应用程序的初创开发团队,得到了硅谷风投的大力支持,但是技术实力与deepseek相差很远,无法解决硬核技术问题。硅谷初创团队在做容易的开发,关注赚钱的前景。
7. 即使大公司支持的精英开发团队,看似人员众多、经费极高,实际战斗力也很可疑。与deepseek相比,硅谷团队过于臃肿,人员水平参差不齐,耗资过多。很多融资巨大的项目,技术上实际乏善可陈。
8. 硅谷曾经有过deepseek式的精英开发团队,UNIX时代,美国本土精英很有水平。但是现在美国依赖H1-B模式,即使这样,人们还在争论H1-B的必要性。真相是,竞争激烈到,即使引入大批HB-B研发人员,也需要很好的研发管理。英伟达是一个好例子,但很多硅谷公司研发实际是低效的。随着deepseek可以低价使用,很多公司的H1-B开发模式会崩溃,需要的是精英开发团队。