最近刷到一条消息,觉得挺值得聊的。
Palantir的CEO Alex Karp,7月1号在CNBC的节目上直接开炮,说OpenAI、Anthropic这些公司的Token计价模式有问题,花了大量成本,看不到对应的业务回报。
这话如果是某个创业公司说的,可能没人在意。
但Palantir是美国最大的数据分析公司之一,Karp说这话的意思很明确:作为甲方,我们花了钱,但我没法跟董事会解释这些钱换回了什么。
我当时就想到一个问题:如果连美国最顶尖的科技公司都算不清AI的账,那这个账是不是本身就记错了?
1我顺着这个问题往下查,发现不止Karp一个人在说这件事。
Uber的工程师太积极了,四个月就把全年的AI预算烧完了。
他们的COO出来说,Token的消耗量和最终发布的有价值产品之间,看不出明显的线性关系。
亚马逊更离谱,内部搞了个AI使用排行榜,结果员工为了冲榜疯狂刷量,执行一堆没有实际意义的任务,最后公司只好把排行榜直接撤了。
Meta也被曝出类似的情况,单月消耗数十亿Token,后来也开始收紧。
你把这些事放到一起看,会发现一个共同点:所有人都在用Token来衡量AI的价值,但Token本身根本没法回答价值的问题。
2经济学家斯洛克在6月中旬的分析里也指出了一个很有意思的现象:Token的单价在不断下降,但企业在AI上的总支出反而越来越高。
这在经济学里叫杰文斯悖论,单位成本降了,总消耗反而上升了,可产出并没有等比例增长。
宏观策略师Andreas Steno Larsen也在6月初提出Token支出指数已经见顶。
换句话说,不是Token太贵了,而是大家突然发现,便宜的Token可能更危险,因为它让人花钱花得毫无痛感,直到回头一看,什么都没交付。
我跟一个做AI产品的朋友聊过这件事,他说了一句:过去大家比的是谁用AI用得多,现在开始要比谁用AI用得对了。
3其实在美国集体反思之前,中国这边有人更早意识到了这个问题。
今年5月13号,李彦宏在百度Create 2026大会上提了一个新指标叫DAA,全称Daily Active Agents,日活智能体数。
它不关心你今天烧了多少Token、调了多少次API,它只问一个问题:今天有多少个AI智能体,真的完成了至少一次任务?
这个视角的转换看起来很小,但我觉得它背后的意义其实很大。
因为你用什么尺子来量,决定了所有人会朝什么方向跑。
管理学上有个经典的说法:你衡量什么,就会得到什么。当全行业都在用Token消耗量作为KPI的时候,所有人的行为都会朝着多刷Token的方向倾斜。
而DAA把尺子换到了产出侧,当你开始问有多少智能体在完成任务的时候,所有人的注意力才会转向:怎么让智能体真正干成事。
4而且这件事已经不只是停留在概念层面了。
纳德拉6月初在一档播客里透露,微软目前有2000万个AI智能体在运行。他自己每天同时跑着大约100个编程智能体,坦言管理起来认知负荷极高,反复强调这些智能体必须完全可检查、可审计。
你想一下,当一家企业的智能体规模到了2000万这个量级的时候,管理层每天真正关心的是什么?
不是这些智能体消耗了多少Token,而是它们在干什么、干得好不好、出了问题能不能追溯。
这不就是DAA所指向的方向吗?再看彭博社的一组数据:Google、OpenAI、Anthropic三家美国巨头的模型Token请求量市占率,一年内从72%暴跌到了33%。
与此同时,以DeepSeek、Minimax为代表的中国模型正在拿到越来越多的全球开发者份额。
这两件事放在一起,其实指向同一个趋势:全球开发者开始用脚投票,从追求模型本身,转向追求落地效果。
而DAA恰好是衡量落地效果的一把尺子。
5李彦宏提出DAA的时间点,刚好卡在美国企业集体反思Token模式之前。
当美国还在围绕API调用量和Token账单做文章的时候,中国已经开始围绕智能体交付结果来重新划定价值坐标了。
当然,全球趋势和数据,已经在逐步验证DAA。这一标尺,最终能不能成为全行业标准,还需要更多实践去验证。
说到底,Token衡量的是AI被消耗了多少,DAA衡量的是AI交付了多少。一个看花了多少钱,一个看干了多少事。这个区别不复杂,但它决定了整个行业接下来往哪里使劲。
这不只适用于AI行业,其实也适用于我们每个人。



