最近刷到一条消息，觉得挺值得聊的。Palantir的CEO Alex Karp，

最近刷到一条消息，觉得挺值得聊的。

Palantir的CEO Alex Karp，7月1号在CNBC的节目上直接开炮，说OpenAI、Anthropic这些公司的Token计价模式有问题，花了大量成本，看不到对应的业务回报。

这话如果是某个创业公司说的，可能没人在意。

但Palantir是美国最大的数据分析公司之一，Karp说这话的意思很明确：作为甲方，我们花了钱，但我没法跟董事会解释这些钱换回了什么。

我当时就想到一个问题：如果连美国最顶尖的科技公司都算不清AI的账，那这个账是不是本身就记错了？

1我顺着这个问题往下查，发现不止Karp一个人在说这件事。

Uber的工程师太积极了，四个月就把全年的AI预算烧完了。

他们的COO出来说，Token的消耗量和最终发布的有价值产品之间，看不出明显的线性关系。

亚马逊更离谱，内部搞了个AI使用排行榜，结果员工为了冲榜疯狂刷量，执行一堆没有实际意义的任务，最后公司只好把排行榜直接撤了。

Meta也被曝出类似的情况，单月消耗数十亿Token，后来也开始收紧。

你把这些事放到一起看，会发现一个共同点：所有人都在用Token来衡量AI的价值，但Token本身根本没法回答价值的问题。

2经济学家斯洛克在6月中旬的分析里也指出了一个很有意思的现象：Token的单价在不断下降，但企业在AI上的总支出反而越来越高。

这在经济学里叫杰文斯悖论，单位成本降了，总消耗反而上升了，可产出并没有等比例增长。

宏观策略师Andreas Steno Larsen也在6月初提出Token支出指数已经见顶。

换句话说，不是Token太贵了，而是大家突然发现，便宜的Token可能更危险，因为它让人花钱花得毫无痛感，直到回头一看，什么都没交付。

我跟一个做AI产品的朋友聊过这件事，他说了一句：过去大家比的是谁用AI用得多，现在开始要比谁用AI用得对了。

3其实在美国集体反思之前，中国这边有人更早意识到了这个问题。

今年5月13号，李彦宏在百度Create 2026大会上提了一个新指标叫DAA，全称Daily Active Agents，日活智能体数。

它不关心你今天烧了多少Token、调了多少次API，它只问一个问题：今天有多少个AI智能体，真的完成了至少一次任务？

这个视角的转换看起来很小，但我觉得它背后的意义其实很大。

因为你用什么尺子来量，决定了所有人会朝什么方向跑。

管理学上有个经典的说法：你衡量什么，就会得到什么。当全行业都在用Token消耗量作为KPI的时候，所有人的行为都会朝着多刷Token的方向倾斜。

而DAA把尺子换到了产出侧，当你开始问有多少智能体在完成任务的时候，所有人的注意力才会转向：怎么让智能体真正干成事。

4而且这件事已经不只是停留在概念层面了。

纳德拉6月初在一档播客里透露，微软目前有2000万个AI智能体在运行。他自己每天同时跑着大约100个编程智能体，坦言管理起来认知负荷极高，反复强调这些智能体必须完全可检查、可审计。

你想一下，当一家企业的智能体规模到了2000万这个量级的时候，管理层每天真正关心的是什么？

不是这些智能体消耗了多少Token，而是它们在干什么、干得好不好、出了问题能不能追溯。

这不就是DAA所指向的方向吗？再看彭博社的一组数据：Google、OpenAI、Anthropic三家美国巨头的模型Token请求量市占率，一年内从72%暴跌到了33%。

与此同时，以DeepSeek、Minimax为代表的中国模型正在拿到越来越多的全球开发者份额。

这两件事放在一起，其实指向同一个趋势：全球开发者开始用脚投票，从追求模型本身，转向追求落地效果。

而DAA恰好是衡量落地效果的一把尺子。

5李彦宏提出DAA的时间点，刚好卡在美国企业集体反思Token模式之前。

当美国还在围绕API调用量和Token账单做文章的时候，中国已经开始围绕智能体交付结果来重新划定价值坐标了。

当然，全球趋势和数据，已经在逐步验证DAA。这一标尺，最终能不能成为全行业标准，还需要更多实践去验证。

说到底，Token衡量的是AI被消耗了多少，DAA衡量的是AI交付了多少。一个看花了多少钱，一个看干了多少事。这个区别不复杂，但它决定了整个行业接下来往哪里使劲。

这不只适用于AI行业，其实也适用于我们每个人。

众力资讯网