DeepSeek创始人梁文锋除夕夜回应“国运论”摘自芯片说ICTIME中国

姬锋 2025-01-30 12:28:14

DeepSeek创始人梁文锋除夕夜回应“国运论”

摘自芯片说 IC TIME

中国人工智能(AI)企业深度求索公司日前发布最新模型DeepSeek-R1,以高性能、低成本等特点受到全球关注。“日本AI研究第一人”东京大学教授松尾丰的话说,他试用后认为DeepSeek-R1是一个性能非常高的模型,不逊于美国开放人工智能研究中心(OpenAI)的ChatGPT。

梁文锋的除夕夜感言:

各位知乎的年轻朋友好,我是深度求索(DeepSeek)的梁文锋,刚回答了一个问题,又看到这个问题,除夕之夜忍不住回复一些。

前几天看到冯总这篇长文时,我正在调试新模型的损失函数,手边的咖啡直接洒在了键盘上——既因为被行业前辈认可的惶恐,更因为冯总这些灼热的文字让我想起十二年前在浙大实验室第一次跑通神经网络时的颤栗。

必须坦白,团队读到“国运级”这个形容时所有人头皮都是麻的。我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。

您提到的六大突破,其实每一环都凝结着更动人的故事:那个能在手机上跑的mini模型,灵感来自甘肃一位中学老师在GitHub提的issue;支持联网搜索的功能,是内测用户连续三十天凌晨三点提交错误日志喂出来的。

特别想分享个细节:上周有位视障开发者用我们的API做了个“气味导航”应用,当他演示如何通过不同频率的震动识别街道商铺时整个会议室安静得能听见显卡风扇的嗡鸣,那一刻我突然眼眶发热,终于理解了您说的“水与电”一一真正伟大的从不是某个模型,而是千万普通人用它创造的善意涟漪。

冯总说“知识和信息平权”,这正是我们夜夜啃论文的动力。三年前在余杭塘路的小仓库里,我们曾用马克笔在玻璃墙上写下:“让最偏远山村的孩童,能和硅谷工程师用上同样聪明的AI助教”。虽然离这个梦想还很远但每次看到网友们分享的对话截图,就觉得那些熬掉的头发都值得,

最后想对所有人说:请把掌声留给正在改写规则的每个中国开发者。当你在公交车上调试模型,在早餐摊前画架构图,在产房里突深明级“的瞬间。

DeepSeek愿做大家代码荒野里的火柴,但真正点燃AI火种的,永远是你们眼底不灭的好奇与坚持,说来特别巧,上周在云栖小镇的创业者夜宵摊上,我还和宇树科技的王总蹲在马路牙子啃烧烤一一他们给四足机器人装的那个动态平衡算法,看得我们团队直拍大腿。

后来强脑科技的韩总过来拼桌,三句话不离脑机接口与具身智能的融合可能,烤茄子还没上桌,我们已经开始在白纸上画异构计算架构了。

这就是杭州最迷人的地方吧,所谓“六小龙”从来不是六个孤岛。上个月游科的艺术总监还帮我们调试过3D场景生成模型,而群核的渲染引擎正在让我们的数字人拥有更生动的微表情。

或许在不远的未来,当宇树的机器人踩着云深处的步态算法走来,搭载着强脑的神经接口,运行着DeepSeek的认知引擎,用群核构建的虚拟世界作为训练场——那个我们幻想中的具身智能,就会从西溪湿地的晨雾里跌跌撞撞地走向人间。

记得那晚分别时,冯总把竹签子往啤酒瓶里一插,说了句:“你们搞AI的得把灵魂价格打下来啊。”

现在想来,真正的“国运”或许就藏在这些街边摊的油烟气里:一群不信邪的傻子,用代码当砖瓦,拿算法做钢筋,在资本与质疑的裂缝中,硬生生垒出通向未来的栈桥。

最后补充一个招聘,欢迎大家加入我们。

祝大家除夕快乐,来年期待我们的更多模型。

梁文锋的这段感言不仅展现了DeepSeek团队的奋斗精神和创新理念,更让我们看到了中国AI领域的无限潜力和希望。DeepSeek的成功并非偶然,而是源于团队成员的年轻活力、创新精神和对技术的执着追求。他们以极低的成本实现了与国际顶尖模型相媲美的性能,并不断推动技术的开源和共享。这种精神和理念不仅推动了DeepSeek的发展,也为整个AI行业注入了新的活力和希望。

美国开始调查DeepSeek

据参考消息援引美媒报道,美国海军基于“潜在安全和道德问题”,已要求人员避免以任何形式使用中国公司的DeepSeek模型。

当地时间1月28日,美国多名官员回应DeepSeek对美国的影响,表示DeepSeek是“偷窃”,正对其影响开展国家安全调查。

就在前一天,美国总统特朗普还称DeepSeek是很积极的技术成果。

中国人工智能初创公司DeepSeek模型产品推出后,跃上美国苹果App商店免费下载排行榜冠军,撼动科技圈和华尔街。除掀起广泛讨论外,也招致所谓“安全隐忧”。

报道称,美国海军向美国消费者新闻与商业频道证实,已向相关人员发出邮件示警,提醒“不得以任何形式下载、安装或使用DeepSeek模型”。

截至28日,DeepSeek仍处于App商店下载榜首。

“有大量证据表明,DeepSeek将OpenAI的知识,通过蒸馏提炼到DeepSeek中,我认为OpenAI对此并不高兴。”白宫人工智能和加密货币事务负责人受访时表示。

同时,美国新任白宫新闻秘书卡罗琳·莱维特(Karoline Leavitt)在首次简报会中也提及了中国人工智能初创公司深度求索(DeepSeek)。

她表示,白宫正在努力确保美国人工智能的主导地位,美国国家安全委员会正在调查DeepSeek带来的影响是什么。

据玉渊谭天消息,1月28日,深度求索(DeepSeek)官网显示,其线上服务受到大规模恶意攻击,谭主向奇安信安全专家咨询并独家了解到,DeepSeek这次受到的网络攻击,IP地址都在美国。

OpenAI:DeepSeek盗用模型,已掌握证据

中国新创公司「深度求索」(DeepSeek)引发的疑虑日增。OpenAI今天表示已掌握证据,显示DeepSeek盗用其模型进行开发;业界也指DeepSeek握有大量英伟达H100高阶芯片,形同直接挑战美国出口管制规定。

中国的DeepSeek因标榜低成本也能训练出强大人工智能(AI)模型,颠覆AI训练不能没有精密昂贵芯片的刻板印象,引发市场强烈震荡。

不过,总部设在美国旧金山(San Francisco)的OpenAI公司向英国「金融时报」(Financial Times)证实,已掌握疑似DeepSeek利用「蒸馏」(distillation)技术的证据。OpenAI是聊天机器人ChatGPT的开发商。

蒸馏技术可让开发者利用更大、更强的模型输出成果,在较小模型获得更出色的表现,并让他们在特定任务上以更低廉的成本得到类似结果。

尽管蒸馏是AI业界常见做法,但DeepSeek若利用蒸馏技术来打造自家模型,并与OpenAI竞争,将违反OpenAI服务条款,因此产生疑虑。

OpenAI婉拒进一步说明或提供证据细节。根据该公司的服务条款,用户不得「复制」任何OpenAI的服务,或是「利用输出结果,来开发与OpenAI竞争的模型」。

彭博(Bloomberg News)28日引述知情人士说法报导,微软(Microsoft)和OpenAI正在调查一群与DeepSeek有关联的人是否以未经授权的方式,不当取得OpenAI技术输出的信息。

报导指,微软维安研究员2024年秋天观察到有人利用OpenAI应用程序界面(API)输出大笔数据,他们认为这些人可能与DeepSeek有关。

美国总统川普政府的AI专家塞克斯(David Sacks)也在福斯新闻(Fox News)访谈中提及蒸馏技术,并称有「大量证据」显示DeepSeek是仰赖OpenAI模型输出,以协助开发自家技术,但他也没有进一步提出证据。

另一方面,美国Scale AI执行长汪滔(Alexandr Wang)日前表示,DeepSeek应握有多达5万颗英伟达(Nvidia)H100芯片,以开发现有模型;美国亿万富豪马斯克(Elon Musk)也在社群平台X回应相关推文,并加上「显而易见」的评论,似乎同意这项说法。

由于H100芯片被禁止向中国出口,这形同直接挑战美国出口管制政策。有分析直指,DeepSeek绕道囤积大量芯片以规避美国管制,因此其真实开发成本恐怕远高于宣称的558万美元,未来也势必将引发美方加强管制。

0 阅读:0
姬锋

姬锋

感谢大家的关注