大模型“全网最低”之战，巨头们葫芦里卖的什么药

大模型战事升级

营销、降价，剑指商业化

6·18购物节狂欢活动正如火如荼地展开，领跑的“榜一大哥”却是大模型这个生面孔。

今年5月，多家大模型齐降价，迅速掀起整个行业的低价热潮。去年以来，随着ChatGPT的快速走红，AI大模型开始井喷式发展，创业公司、头部企业纷纷入局，新领域一跃成为投资市场的香饽饽。大厂为何竞相降价？降价后的大模型赛道又将迎来怎样的变化和挑战呢？

大模型跳水降价，巨头激战正酣

想要感知这次大模型降价潮的力度，首先需要了解“token”是什么，它是服务端生成的一串字符串，以作客户端进行请求的一个令牌，通俗来讲，其实可以理解为大模型文本处理过程中的最小单位。

5月6日，幻方量化旗下DeepSeek发布第二代MoE（专家模型）DeepSeek-V2，该模型在性能上对标GPT-4 Turbo，价格却仅有后者的百分之一，每百万tokens输入价格为1元、输出价格为2元。

随着DeepSeek打响大模型降价第一枪，几大巨头先后卷入价格战。几天之后，智谱AI上线新的价格体系，大幅提升新用户的赠送额度，其入门级产品GLM-3 Turbo模型调用价格则降低80%至1元／百万tokens。

5月15日，火山引擎原动力大会开幕，字节跳动发布豆包大模型并公布0.0008元/千tokens的超低定价，凭借比行业低99.3%的价格，字节将大模型带入“厘元时代”。

火山引擎总裁谭待在火山引擎原动力大会上解读定价

随后，5月21日，阿里云宣布通义千问GPT-4级主力模型Qwen-Long，API（应用程序编程接口）输入价格由0.02元/千tokens降至0.0005元/千tokens，降幅达到97%，比豆包大模型的0.0008元/千tokens更低。

至此，其实大模型已经没有更多压价空间。当日下午，百度宣布文心大模型中的两大主力模型 ERNIE Speed 和 ERNIE Lite 全面免费。

次日，科大讯飞和腾讯立刻跟进降价，讯飞星火API能力正式免费开放，其中，讯飞星火Lite API永久免费开放，这也是业界首个永久免费版本，此外，科大讯飞还压低了顶配版本的价格，腾讯则宣布混元-lite模型全面免费开放。

事实上，大模型降价早有趋势。自去年开始，赛道领头羊OpenAI已经先后进行了4次降价，不久前，其发布的最新模型GPT-4o，不仅性能实现大幅提升，价格也下调了50%。

OpenAI在春季发布会上推出新旗舰模型GPT-4o

从卷参数到卷低价，赛道开始急速升温，吸引众多市场目光的同时，也不禁令人疑惑：巨头如此舍本烧钱，目的究竟是什么？

为商业化清障

从客观来看，技术取得一定进步后，降价其实顺理成章。一方面芯片技术突破导致算力成本下降，压缩了大模型的推理成本，另一方面是大模型的量化压缩技术也在不断优化，二者的结合使大幅度降价成为可能。

此外，经过一年多的市场化发展，文本生成领域的大模型目前相对成熟，其在端侧的运行其实无需太多成本，还能帮助企业最大化利用过剩产能。

然而，技术进步并非主要原因，算力优化虽然能降低成本，但眼下各大厂商的降价幅度显然超出了正常范畴。实际上，尽管ChatGPT让大众感知到AI技术的进阶，但赛道目前仍处于初期阶段。在AI大模型爆发之初，市场对技术驱动的服务优化热情高涨，推动了智能服务对基础层服务的汰换迭代，而随着进度条的延伸，应用化的下一个增长空间在哪？行业迟迟未能给出答案。

降价，其实是头部企业试图突破技术和规模瓶颈的商业策略。

单一的人机对话窗口，在端侧的吸引力是有限的，因为这需要用户具备文本提问和寻找答案的主动意识。另外，许多镶嵌在主流APP中的AI智能助手作用较为鸡肋，实际上这些APP已经具有稳定的用户群体，并形成稳定的交互模式，很难在内部二次孵化对AIGC的大量需求，而AI智能助手所能提供的支持也仅限于给出方案以作参考，例如购物时提供衣物搭配和物品的使用方法、出游订票时提供榜单数据和目的地选项等等。

总而言之，由于场景渗透的局限性，现阶段C端用户的使用习惯尚未成型，加上此前设置的价格进一步抬高使用门槛，又缺乏爆款应用作为宣传载体，大模型的用户规模虽然在前期实现了快速增长，但总体仍有很大提升空间。QuestMobile发布的《2024中国移动互联网春季大报告》显示，截至今年3月，基于大模型的AIGC行业用户量为7380万，尽管同比增长了8倍，也仅占移动互联网用户量的6%。

在整体的市场蛋糕未能做大的前提下，各家所分得的市场显然十分有限，而在相似度极高的发展路径下，各家大模型产品的用户粘性更是无从谈起。

对于头部企业而言，在技术和市场规模双双陷入增长瓶颈时，非常需要更多开发者和用户的加入，突破圈内自嗨转向全民应用，一是能为行业注入新鲜血液，或许有机会激发更多技术上的创新，二是有助于推动AI应用的普及，促进大模型的应用化，从而为进一步实现商业化奠定市场基础。当然更重要的是，行业竞争无处不在。

阿里通义千问系列大模型调价后，记者曾就此询问字节方的看法。火山引擎相关负责人表示:”非常欢迎通义千问大模型降价，共同助力企业以更低成本探索AI转型，加速大模型应用场景落地。”

官话虚虚实实，事实上在大模型整个商业市场内，技术进步是普惠的，企业间的你追我赶向来残酷目前行业格局尚未定型，各大国产厂商都希望能尽快抢占先机，争夺更多的市场份额，形成一定业务规模后，再考虑利润收益。

如何抢占先机？火山引擎总裁谭待在演讲中指出：“大的使用量，才能打磨出好模型。”也就是说，吸引用户的核心价值在于积累使用数据，能在前期铺开市场就能拿到更多数据，有了数据基础，就能支撑后期的性能优化，培养更强的市场竞争力，从而使行业显现马太效应。

眼下，既然技术暂时无法拉开差距，降价就成为最可行的刺激手段。但卷至降无可降，其实厂商们又回到了同一起跑线。

一场“免费”营销

按理来说，集体降价利好整个行业，因为大模型成本优化可进一步激发算力需求，对技术的升级迭代和商业化落地，乃至整个产业生态的构建都是好事。不过，“烧钱换数据”终究是厂商们的权宜之计，大模型的研发、更新、维护始终需要持续投入，成本压力并未凭空消失。

一方面，B端企业客户的需求是产品研发，对大模型的算力要求只高不低。另一方面，AI大模型不同于其他企业服务，需要结合企业自身的领域和需求情况来选择合适的落地技术路线，无论是技术内容还是交付方式都很难标准化，因此人力成本和技术成本不能一味压缩。

更何况模型训练阶段的成本已经很高，后期的模型推理应用阶段，所需投入更是难以估量，因为规模化应用需要保证成百上千万用户的频繁操作，必将伴随算力成本的指数级飙升。那么投入的成本从何而来？企业只能通过生态“转移支付”，吸血其他业务的利润。

此外，目前降价潮仅局限于文字生成这个板块，其他模态的变化非常有限，所以距离“全面免费”时代其实还很远。并且回看各大厂商大幅降价和免费开放的模型，大多是偏轻量化的版本，顶配版本的核心产品并未参与其中，好的东西仍然需要付费。

总体而言，虽然热点频出营造出行业整体降价跳水的表象，实则营销噱头远大于实际。

从团购的“千团大战”到电商的“百亿补贴”，从网约车的红包翻飞到共享单车的“1元包月”，其实互联网从来不缺少“免费”的故事。如今这场群戏再次上演，让人不禁感慨互联网大厂刻在骨子里的路径依赖，其实大家一直在套用同一套打法公式：烧钱铺市场、降价搞营销、大鱼吃小鱼，一套合纵连横的组合拳打下来，行业格局也基本成型。

招数不在新，管用就行。巨头游戏向来刀光剑影，最终谁将笑傲江湖，或许从此刻就已开始埋下伏笔。

低价常态化

大模型普及和应用落地的双赢

这次国内大模型市场的全面降价来势汹汹，前面我们也分析了各大云厂商在这个时间节点开始卷价格的原因，但深入来看，这次的“价格战”其实并不具有全面性，厂商也绝不可能当大善人，各家也都是抱着各种各样的目的和想法参与了此次降价，那么从宏观角度来看，我们作为终端用户，应该如何看透这波大模型降价潮呢？

对于大多数企业来说，大模型依然是新技术，市场并没有被真正打开，而大幅度降价就是打开市场的钥匙之一，因此国产大模型打价格战其实并不意外，利用冗余产能，低价甚至免费是最直接有效的方式。但同时任何事物都有两面性，现阶段的大模型降价多少有点不痛不痒的感觉。

为什么这么说呢？现在价格被打下来的主要是文字生成类大模型，各大厂商并没有把别的模态价格也打下来，之所以选择文字生成类大模型，是因为经历了一年多的技术迭代，效果比较好的大模型现阶段已经可以在用户端部署了，客观来讲这种部署方式本来就是免费的。而且阿里、百度降价幅度最高的产品都是其偏轻量化的模型版本，仅适用于使用频次不高、推理量不太大、任务处理量不太复杂的中小企业、开发者短期使用。

各家最先进的大模型依然有不低的使用成本

即便是业界领头羊OpenAI，它现在也提供两种报价方案，一种价格较高，对应的服务响应比较快，另一种则是下调价格，但响应慢一些，显然，后者卖的其实就是服务器的剩余资源。

所以大模型厂商不太可能让自己最好的模型免费或大幅降价，因为最先进的大模型算力成本也确实摆在那里，这也是很多从业者对大模型“价格战”并不兴奋的原因，他们不会因为便宜就改变选择，更不会因为贵就放弃好的模型。

而且这次降价从技术角度来看，更多还是因为大多成熟的大模型通过长时间优化迭代之后，模型成本只有开发初期的十分之一，同时还能保持同等效果，所以只要有一家先降价，其他家也都有能力顺势跟进，这也是能够引发本次大模型降价浪潮的关键原因。

据《2024年中国大模型能力评测》分析，中国大模型与国际一线还存在代差

更重要的是，国内这批大模型理论上与OpenAI等一线厂商产品存在代差，业内人士估计可能要半年到一年的时间才能补上差距，也就是说，现在这波低价其实是用旧模型去促销，抢存量市场，通过降价拉高市场使用量，再反哺大模型的继续迭代。

利用这次降价，大模型创企可以使自己快速获得关注和客户，争取生存空间、提升影响力，而从云厂商的角度，则能够利用价格手段进一步强化自身在云服务市场的主导地位，对抗竞争对手冲击，考虑到国内有相当多的大模型玩家本身就是云服务供应商，靠大模型降价来吸引更多的云计算客户就成了一条看起来还挺有前途的道路，所以比起真正的大模型“内卷”，这场价格战更像是一场云计算大厂为了争夺云市场，在另一赛道布下的战局。

云服务同步降价

抢占数字基建“地盘”

Lepton AI创始人、阿里巴巴原副总裁贾扬清近日在朋友圈分享了自己的观点，他认为站在整个AI产业的角度，降价是个“拍脑袋就可以做的简单策略，但是真正的To B商业成功更难”，最重要的一点就是企业不是因为AI贵才没用，而是企业还不清楚到底怎么用，才能产生业务价值。从目前的“战况”来看，降价最凶的都是自己有云服务的大厂，他们通过大模型来获取云客户，而大模型创企没有这样的生态，必须另寻商业模式。

我们电脑报的官方网站数据也托管于阿里云，近期也经常接到客服电话，通知可以更优惠的价格续约，同时我们也收到了不少其他云服务商的报价，总体来说都有明显降低。但我们网站部相关负责人也表示，企业其实对数据安全和稳定性的要求更高，因为预算都是提前制定的，降价虽然可以降低成本，但数据迁移也可能带来更多麻烦，因此已经磨合得很好的云服务厂商依然是首选。而且在实际的应用侧，用户其实根本不在乎你用了什么模型，他只在乎你的场景，所以云服务和大模型的成本影响并不大，只要把用户最关心的某个场景问题解决了，在此基础上，成本其实都是可以回收的。所以眼下国产大模型的“价格战”更像是营销手段，可以为厂商带来短期爆发的流量，而真正决定留客率的还是模型和云服务本身的技术水平。

数字中国等政策不断加码，保证了AI新应用持续推新

而从数字基建的角度来说，国内现在也由几个头部大厂主导，比如这次参与了大模型降价的阿里云也是当初国内云服务的先行者，同时也是这两年数次降价浪潮的掀起者。

当初的云服务几次降价带动了不少中小企业上云，如今在大模型行业掀起价格开卷，对于本来就有在云端有数字业务，同时又有AI需求的企业来说，价格也将不再是重点考虑因素，像阿里云这种1元最多可买到200万tokens的价格，对于创业者和企业来说基本上相当于不要钱了，给了几乎所有需要数字基础建设，同时又想加入到AI行业的中小企业和创业们一个超低的入行门槛，也为厂商抢占市场提供了新的契机。

开源阵营受冲击？

孰优孰劣还尚无定论

这次大模型集体降价，不少人都在担心开源大模型会不会遭受冲击，但正如我们前面所说的，模型的能力才是决定其是否受用的关键，成本倒是其次，我们也采访了某不愿透露名称的外贸企业负责人，其业务部门购买过ChatGPT、Midjourney等付费产品来提高工作效率，现在底层使用的是Meta开源且可商用的Llama 3，之所以没有放弃开源大模型的原因是开源模型其实很多也来自大厂，比如Meta、阿里巴巴等，其能力并没有因为开源而落后，而且在一些通用场景能力在业务中足够用，没有必要去折腾。

从具体能力来说，阿里云通义千问发布最新款开源模型Qwen1.5-110在基础能力评估中与Meta-Llama3-70B相媲美，也在降价期间进行了七天限时免费的活动，阿里云CTO周靖人就曾表示“不是所有闭源公司的大模型都能比得上开源模型。”而大模型公司之所以选择开源，主要就是用来抢占市场先手，因为开源模型的商用成本相对较低，没有足够财力和资源的企业在初探AI时会优先选择使用开源模型，从而让大模型公司通过获取更多的用户反馈和使用痛点，帮助模型迅速迭代。

根据权威平台“大模型竞技场”，即便是中文应用，闭源大模型也是遥遥领先

当然，有支持开源的，就有支持闭源的，现在的OpenAI、百度就是闭源路线的坚定支持者，百度CEO李彦宏就曾断言“开源模型会越来越落后。”其理由是通过文心4.0蒸馏出来的更小尺寸模型，比直接拿开源模型调出来的模型，同等尺寸下效果明显更好，而同等效果下成本明显更低。

与Meta完全开源、OpenAI和百度极致闭源的路线相比，其余大模型公司更多选择中间路线：低配版模型开源，更高参数量的模型闭源，以王小川创立的百川智能为例，2023年4月成立之初发布的第一代Baichuan大模型和9月发布的Baichuan 2均开源，但今年1月推出的超千亿大模型Baichuan 3则完全闭源……所以综合来看，这次大模型降价潮对开源与闭源的影响其实并没有那么直接，孰强孰弱的话题或许还要继续争论下去……

众力资讯网

大模型“全网最低”之战，巨头们葫芦里卖的什么药

壹零社科技宅