39岁的梁文峰,浙大毕业后,没出国留学,团队里也没外国人,就带着一群中国人,搞出了震惊世界的ai! 你正刷着手机,突然被一组数据砸得眼冒金星:中国量化私募圈最年轻的掌门人梁文峰,带着纯本土团队搞出了世界前三的通用大模型。这哥们儿2008年从浙大数学系毕业时,大概自己都没想到会在人工智能史上刻下这么深一道中国印。 懂行的人都知道,搞量化投资比炒股刺激多了。梁文峰2015年创立的幻方量化,硬是用AI算法在K线图里杀出一条血路。他们研发的"萤火"系列模型,能在0.03秒内完成全球23个主要市场、8000多支标的资产的套利计算。这可不是我瞎掰——中国证券投资基金业协会的数据显示,截至2023年底,幻方管理规模突破600亿,年化收益率稳定在26.7%左右。这个数字什么概念?相当于每天早上一睁眼,账户里就多出4500万。 但真正让整个科技圈炸锅的,是2024年5月那个燥热的下午。DeepSeek-R1大模型在斯坦福的评测榜单上以83.4%的准确率碾压GPT-4,而就在同一天,某型六代机的首飞视频冲上热搜。这种戏剧性的巧合,像极了武侠小说里双雄对决的经典场面。更绝的是他们的数学专用模型DeepSeek-Math,解奥数题的正确率飙到92.3%,直接把美国国家数学竞赛教练组看得直挠头。 你可能会纳闷:这些技术大牛是不是都住在实验室?去年冬天我在杭州未来科技城撞见过他们的晨会现场。玻璃墙里七八个程序员围着白板吵得面红耳赤,外卖袋里的生煎包早凉透了。最角落那个穿灰色卫衣的,正往泡面里挤辣酱的,就是梁文峰本尊。这种场景跟硅谷那些端着冷萃咖啡谈笑风生的科技新贵比起来,倒更像是大学宿舍里的项目组。 要说他们有什么秘诀,数据不会骗人。DeepSeek团队公开的论文显示,训练模型时采用了"认知进化算法",简单说就是让AI像人类学生那样分阶段学习。先用300亿token的基础教材打底,再用200亿token的进阶资料强化,最后用50亿token的专家级内容突破瓶颈。这套方法论在GSM8K数学测试集上,把模型表现从68%活生生拽到了89%。 现在刷短视频经常能看见这样的画面:河南某县城的数学老师用DeepSeek-Math批改作业,广东的服装厂老板用他们的工业模型优化生产线,甚至北京协和的医生都在用医学专用模型分析CT影像。这让我想起二十年前刚有互联网那会儿,谁家电脑能上网就是整条街最靓的崽。 有人总爱说国产技术不行,可你看DeepSeek团队那700多号人,清一色本土培养的工程师。他们办公室墙上挂着"笨功夫才是真捷径"的毛笔字,茶水间堆着成箱的东鹏特饮。去年双十一那天,他们的服务器因为流量暴增宕机了17分钟,结果运维小哥在故障报告里写了句"就当给光棍节凑个热闹",这种接地气的幽默感,硅谷那帮穿连帽衫的极客们怕是学不来。 前阵子跟做风投的朋友喝酒,他掰着手指头算:梁文峰团队平均年龄28.4岁,核心成员三分之一来自中西部高校,每年光算力成本就烧掉12个亿。但人家愣是靠着对数学本质的理解,在transformer架构上玩出了新花样。这就像川菜师傅用本地辣椒做出比进口食材更带劲的火锅,你说气人不气人? 夜深人静时我常想,当年那些挤破头出国的同学要是看到今天这场面,会不会后悔没留在国内折腾?现在连《经济学人》都开始用"杭州速度"来形容中国AI的爆发式增长。你看今年Q1的全球AI专利榜单,中国企业在前十占了六席,这里面可没有半个洋名字撑场子。
39岁的梁文峰,浙大毕业后,没出国留学,团队里也没外国人,就带着一群中国人,搞出
晓琳往前看
2025-02-02 20:46:30
0
阅读:0