本以为横空出世的DeepSeek,是去跟硅谷巨头硬刚的国货之光。弄了半天,梁老板端着世界级的AI模型,转身扎进交易市场磨刀霍霍。这哪是同台竞技,这是赤裸裸的降维屠杀。
麻烦看官老爷们右上角点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!
要说清楚这件事,得先从梁文锋的老本行说起。这人1985年出生在广东湛江,浙江大学毕业,学的是信息与电子工程,硕士读完后没去大厂写代码,而是跟几个同学一头扎进了量化交易的江湖。2008年全球金融危机那会儿,别人都在恐慌,他带着团队开始用机器学习分析市场数据,尝试搞全自动量化交易。2015年,幻方量化正式成立,靠着数学和AI做投资,在高频策略上迅速打出名头。
2016年是幻方的一个关键节点。10月21日,第一个由深度学习模型生成的股票仓位上线实盘交易,这是业内最早一批用GPU做量化计算的案例之一。到了2017年底,幻方几乎所有的量化策略都已经用AI模型来跑。2018年,幻方正式确立了以AI为核心的发展战略,同年还拿下了私募行业的金牛奖。
说白了,梁文锋搞AI,比ChatGPT出来早了整整五年。他不是追风口的人,风口是他自己吹起来的。
随着业务规模滚雪球一样扩大,算力成了最大的短板。量化交易拼的就是速度,谁模型跑得快、数据算得准,谁就能在市场里吃肉。普通电脑根本扛不住这种级别的运算需求。2019年,梁文锋带着团队自己动手,花两年时间自建了“萤火一号”AI训练平台。2020年这东西正式投入运作,占地面积相当于一个篮球场,累计投资过亿元,搭载了1100块GPU,算力号称能顶4万台个人电脑。它支持超大型神经网络训练,4亿个参数的模型跑一轮只需要84个小时。
一年之后,更大的手笔来了。2021年幻方投入10个亿,开建“萤火二号”。这个超算集群搭载了约1万张英伟达A100显卡,算力规模在当时的国内量化圈几乎找不到对手。更狠的是技术方案,“萤火二号”搞了一套“任务级分时调度共享”的机制,说白了就是把算力资源像CPU时间片一样切碎了按需分配,让集群的平均利用率常年保持在90%以上。这就好比你把一万台超级计算机连成一片,谁要用就临时分配,用完就收回,谁都不耽误谁。
搞量化能赚多少钱?2021年幻方的资产管理规模一度突破千亿,稳稳坐进国内量化私募“四大天王”的行列。这些钱不只是数字,它们是梁文锋后来烧在AI上的弹药。
2023年7月,梁文锋正式创立DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,由幻方量化孵化。这家公司从诞生那天起就没怎么为钱发过愁,梁文锋自己说过,研究经费来自幻方量化的研发预算,他不靠外部融资活着。这种底气,在烧钱如烧纸的大模型赛道里,几乎是独一份。
DeepSeek的团队规模不大,满打满算也就139个工程师和研究人员,跟OpenAI的一千两百人完全不在一个量级。但人少不代表活儿糙。2024年5月DeepSeek-V2发布,API定价每百万tokens输入一块钱、输出两块钱,直接把成本打到GPT-4 Turbo的百分之一。这一下把国内大模型市场搅得天翻地覆,百度、阿里、字节跳动全跟着降价,梁文锋后来接受采访时说,不是故意当鲇鱼,只是不小心成了鲇鱼。
真正让全世界闭嘴的是2025年1月发布的DeepSeek-R1。这模型在LMSYS Chatbot Arena的文本竞技场里排名总体第六,是所有开源模型里的第一名;编程能力排第二,数学推理排第五,复杂提示词处理排第四。简单说,一个中国公司搞出来的开源模型,在好几个关键指标上跟OpenAI和谷歌的顶级闭源模型打得有来有回,成本却只有人家的零头。硅谷那边直接炸了锅,OpenAI前政策主管、Anthropic联合创始人杰克·克拉克说DeepSeek雇了一帮“高深莫测的奇才”。梁文锋的回应更绝——做出这个模型的核心团队,没有一个是从海外回来的,全是国内毕业的年轻人、应届生和博士实习生。
2025年12月,英国《自然》杂志公布年度十大科学人物,梁文锋榜上有名,被评价为“科技颠覆者”。《自然》在评语里说得很直白:这个大语言模型的表现媲美现有最先进模型,但构建资源仅需后者的一小部分。
2025年幻方量化交出了一份漂亮的成绩单。据私募排排网的数据,幻方量化2025年的收益均值达到56.55%,在百亿级量化私募里排第二。近三年收益均值85.15%,近五年收益均值114.35%。目前幻方管理的规模超过700亿元。有业内人士算了一笔账,按照1%的管理费和20%的业绩提成来算,幻方去年一年可能就有超过7亿美元的收入进账。作为对比,DeepSeek公开披露的V3模型总训练成本是557万美元。也就是说,幻方一年赚的钱,够DeepSeek烧上百次。
这才是梁文锋真正的杀招。

