【科技竞赛升温,中国庆祝DeepSeek在人工智能领域的突破性成功】〔CNN

理性闲谈天下事 2025-01-29 13:49:54

【科技竞赛升温,中国庆祝 DeepSeek 在人工智能领域的突破性成功】

〔CNN〕本土科技初创企业DeepSeek及其创始人的最新人工智能模型在硅谷和华尔街引起震动, 全中国 人民都为他们的成功欢呼。

“ deepseek 一夜之间颠覆了美国股市”,这是中国社交媒体平台微博上的一个热门话题标签,阅读量达到数千万。“DeepSeek 让 Meta 感到恐慌”,另一个人说道,他指的是这家在开发自己的人工智能模型方面投入巨资的美国科技巨头。

本周初,随着 DeepSeek 飙升至国际应用商店排行榜榜首,并于周一超越美国公司OpenAI 的 ChatGPT, 十多个与尖端技术相关的主题标签在微博上流行起来。

DeepSeek 创始人梁文峰也被誉为一位科技远见卓识者,能够帮助中国开创与硅谷相媲美的创新文化。

这位工程师出身的企业家很少接受采访,他以只聘用国内人才和保持其人工智能模型开源而闻名,允许其他公司或用户测试和构建该模型。

梁是面向人工智能的对冲基金 High-Flyer Quant 的联合创始人,他于 2023 年创立了 DeepSeek。这家初创公司的最新型号 DeepSeek R1 于 1 月 20 日发布,其能力几乎可以与其更知名的美国竞争对手相媲美,包括 OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini。不过,该公司声称,它的制造成本不到 600 万美元——仅为其他公司投资的一小部分。

著名科技投资者马克·安德森 (Marc Andreessen) 称赞该模型是“斯普特尼克时刻”,美国总统唐纳德·特朗普周一称这一突破为美国在与中国的竞争中敲响了“警钟”。技术主导地位,尤其是在人工智能领域,已成为两大国之间的关键战场,近年来,美国限制中国公司获取可能推动人工智能快速发展的芯片。

分析人士表示,需要更多信息来验证 DeepSeek 对其产品价格的说法,并指出该应用在中国政府对言论和信息施加的严格限制范围内运行。

但对许多中国人来说,这项技术的成功——以及梁对DeepSeek的愿景和精神——标志着中国在竞争激烈的国际舞台上向前迈出了重要一步。

“不管老派势力有多大,也可能一夜之间被推翻,”微博上一条得意洋洋的评论写道,这条评论获得了一千多点赞。

另一则帖子写道:“梁的成就……堪称国家命运。”

CNN 已联系梁、DeepSeek 和 High-Flyer Quant 征求意见。

——“改变游戏规则”

梁先生出生于 1980 年代,父亲是一名小学教师,在中国南部省份广东的一个小城市长大。据中国官方媒体报道,他后来进入浙江大学学习信息与电子工程,浙江大学是中国东部科技中心杭州的一所名校。

最近几天,官方金融媒体《第一财经》采访了 DeepSeek 的早期商业伙伴,他们回忆起这位未来的创始人有点“书呆子气”,并回忆起他过去的“发型很糟糕”。

据该媒体报道,梁曾谈到训练大型人工智能模型和“改变游戏规则”的想法,但没有人认真对待他,但未透露早期的合作伙伴的名字。该媒体称,这种壮举通常只有字节跳动或阿里巴巴等中国科技巨头才能实现。

据官方媒体报道,梁先生于 2015 年与他人共同创立了以人工智能为导向的对冲基金 High-Flyer Quant,当时距离他完成本科学习还不到十年。据该公司网站称,该基金将人工智能机器学习模型纳入其运营中。

与此同时,据官方媒体澎湃新闻报道,该公司正在将计算能力集中到一台篮球场大小的人工智能超级计算机中,成为中国处理能力最强的公司之一,也是唯一一家不是大型科技巨头的公司。

2023 年,梁创立了 DeepSeek,专注于推动通用人工智能领域的发展,并且显然致力于重塑中国的创新文化。

“我们经常说中国和美国之间有一两年的差距,但真正的差距是原创和模仿之间的差距。如果这一点不改变,中国将永远是一个追随者,”梁在去年 7 月接受专注于金融和科技的中国媒体 36Kr的一次罕见媒体采访时表示。

DeepSeek 的崛起大致与政府对科技巨头的严厉打压 逐渐结束相吻合,政府部门希望重新控制一批在政府眼中过于强大的创新型私营企业。

但北京也非常重视培养技术实力,中国领导人在过去一年中誓言要提高技术的自力更生能力和实力——特别是在面对与美国日益激烈的技术竞争时。

梁似乎提到了美国技术出口管制带来的困难——他在去年接受36氪采访时表示,其公司面临的挑战不是资金,而是对“高端芯片”的禁运。

但他也对中国未来的竞争力表示乐观。

“当社会允许核心创新者取得成功时,集体思维就会改变。我们只是需要更多具体的例子和过程,”梁告诉媒体。

——“我们不做平庸之辈”

据官方媒体报道,该公司在北京和杭州设有团队,规模较小,仅有不到 140 名研究人员和工程师,与中国和美国引领人工智能模型创建的大公司相差甚远。

梁在去年的同一采访中表示,DeepSeek 的员工都是在国内招募的,他称他的团队都是来自中国顶尖大学的应届毕业生和博士生。

“前 50 名人才可能不在中国,但也许我们可以自己创造这样的人才,”他告诉 36 氪,并指出工作是“自然”地根据每个人的优势来分工的。“创新首先需要信心。这种信心在年轻人身上通常更明显,”他补充道。

现正在美国留学的前 DeepSeek 员工王子涵在本月发表的《麻省理工技术评论》采访中表示,该公司提供了“任何公司很少有应届毕业生能享受到的奢侈待遇”——丰富的计算资源和实验的自由。

王说,整个团队在研究方面有着共同的“协作文化”。

DeepSeek 网站和各大求职网站上的活跃招聘广告显示,该公司正在招聘深度学习研究人员、工程师和用户界面设计师。

其中,收入最高的工程师职位月薪最高可达 9 万元人民币(12,400 美元)。相比之下,根据科技行业薪资洞察平台 levels.fyi 的数据,谷歌软件工程师的基本工资最高可达 29,000 美元以上。

DeepSeek 官方微信社交媒体账号上的一篇帖子宣称,该公司致力于“探索 AGI 的本质”。帖子补充道:“我们不做平庸的事情,而是以好奇心和深远的眼光来回答最大的问题。”

0 阅读:2
理性闲谈天下事

理性闲谈天下事

感谢大家的关注