DeepSeek,一个普通的语言模型竟然又让愚昧的群众们高潮了。更可笑的是有人竟然将其与国运联系到一起了。 第一,DeepSeek怎么吹也就是个语言模型而已,它也是构建在torch深度学习框架之下,建立在transformer结构上的东西。完全算不上什么革命性创新!现在有传言它是靠GTP4蒸馏出来的,我没有明确证据我不敢胡说八道,但DeepSeek相对于目前OpenAI的GPT还有很大的差距!甚至是“代差”! 第二,DeepSeek确有个别指标超过GPT4,但是这些指标主要是中文处理方面的指标。至于原因大概不用我解释大家也都知道; 第三,训练DeepSeek确实用了更低的成本,但是它训练的模型是两年前OpenAI的当量模型,你猜OpenAI今天再训练一个GPT4需要多大成本?更何况它用的是H100,吹捧的人难道不知道害臊? 第四,最近几天可能英伟达股价有波动,就有人吹“DeepSeek”打掉英伟达2万亿市值。上次吹中国对英伟达进行反垄断调查让英伟达股价下跌的教训怎么就没长记性呢?英伟达股价下跌和DeepSeek有啥关系啊! 论语里有文“知不足而奋起”,可没告诉后人要知不足而把头埋到沙子里! — ——与真正希望中国科技创新的作者们共勉!
DeepSeek,一个普通的语言模型竟然又让愚昧的群众们高潮了。更可笑的是有人竟
刘普洛夫斯基的体育故事
2025-01-28 07:55:31
0
阅读:13