本文评析李彦宏提出的DAA智能体度量指标,肯定其认知进步,指出其不足,剖析百度提出该指标的动因,点明完整度量指标仍待完善。 ## 1. 既有AI度量指标均存在本质缺陷 传统互联网DAU指标不适用于AI时代:AI每新增一个用户都会增加推理成本,DAU从互联网时代的收益指标变成了AI时代实打实的成本项,已被行业放弃。 由英伟达与OpenAI推火的Token消耗量指标仅统计成本而非产出:该指标默认消耗Token越多创造价值越多,但实际Token消耗只代表投入,100万Token未完成任务的数据表现优于10万Token交付结果,无法反映真实产出价值。 ## 2. DAA实现认知跃迁但仍缺关键刻度 李彦宏提出的DAA(日活智能体数)核心定义为:统计每日替人干活并交付结果的智能体数量,完成了度量主体从人到Agent的认知范式切换,将竞争焦点从流量获取转向任务完成,是比DAU、Token更贴近AI价值的进步。 DAA仅为存在性过程指标,缺少可操作的结果度量路径:它仅能统计有多少Agent在运行,按照其逻辑,5个Agent实现10.21%提效会优于3个Agent实现20%提效,未将“交付结果”量化,只完成了度量指标的一半。 ## 3. 百度提出DAA是换赛道的竞争策略 在Token消耗量主导的价值叙事中,百度在算力、基础大模型领域都处于先天劣势,既无法对标海外GPT、Claude,也难以比拼国内DeepSeek、智谱。 百度提出DAA,是将竞争核心从基础设施层转移到应用生态层,在该赛道百度拥有相对可竞争的积累,无需在劣势战场被动追赶。 ## 4. 当前AI价值度量仍待补全下半截 DAA为AI行业指明了衡量方向,在当前跑马圈地的粗放阶段,推动Agent跑起来、多跑并拿到结果是合理竞争姿态。 如何量化“Agent产出的价值密度”仍是悬而未决的问题,给出可操作量化答案的主体,才能补全AI价值度量的完整标尺。
李彦宏的DAA,只能度量一半的Agent
2026-05-27 22:01

李彦宏的DAA,只能度量一半的Agent

本文来自微信公众号:产品变量,作者:亨亨,头图来自:AI生成


这个月早些时候,百度开了一个 Create 2026 大会,一大波自媒体都在写李彦宏的软文。百度并没有邀请我,但大会上提出的 DAA 概念,的确让我有所触动,所以自来水地说几句,希望百度公关部看到,以后也让我吃上这碗饭。


AI 时代跑得很快,但在行业里,用什么来衡量 AI 的发展和落地程度,一直没有公允的指标。


李彦宏提出的指标,叫做DAA,Daily Active Agents,日活智能体数。这是整场大会一个最核心的论题,是想论证,在 AI 时代下,最核心的指标是看每天有多少 Agent 在运行并交付结果。


尽管百度在 AI 的领域,完全是起个大早赶个晚集,但是李彦宏对于前沿领域趋势的判断力,一直都比较在线。2020 年,大家还没太多 AI 的意识,百度就宣布要做 AI 原生公司,2022 年 GPT 席卷而来,百度第一个发布了中国的 LLM 大模型文心;2024 年李彦宏提出不要做超级 App,而是要做智能体生态,后来 2026 年被称之为“智能体元年”,龙虾、ClaudeCode、Codex 等 Agent 平台成为主流;2025 年百度世界大会,李彦宏又提出了“AI 内化”和“自进化”,那目前 AI 最明确的方向就是 Hermes,通过带有自进化能力,来实现 AI 在应用层的能力提升。


所以百度的产品掉队是客观现象,但历史的经验告诉我们,李彦宏本身的判断并没有错。百度的产品要不要用再说,但是李彦宏的话要听。


那就借着这个 DAA,来聊一聊AI 时代平台繁荣程度、AI 使用深度的衡量标准。


天下苦 AI 应用无度量指标久矣!


一、Token 的问题是只衡量支出


受到互联网时代的惯性影响,AI 时代第一个拿来衡量结果的指标,还是 DAU。


但很快,人们就发现不对劲,DAU 之所以能成为互联网时代的指标,是因为互联网逻辑下,平台的研发成本恒定,用户量增多,并不会增加新的成本,反而代表着平台掌握更多的注意力,可以贩卖更多的广告。所以,DAU 指标创造新增益,同时还不产生新成本。


但 AI 时代,每多一个用户,推理成本就会增加一份,不会因为规模效应而让推理便宜,DAU 不再能代表潜在收益,而是实打实的成本项。所以很快,DAU 的叙事就被 AI 行业放弃,有人高喊出“DAU 已死”的口号,宣告 DAU 这个指标在 AI 时代的落幕。


第二个被行业共识的指标是 “Token 消耗量” ,这是一个几乎成为主导 AI 价值叙事的度量单位。


这套标准,主要由英伟达和 OpenAI 共同构建。前有 Sam Altman 在 2025 年 OpenAI 开发者大会上提出“万亿 Token 俱乐部”,后有黄仁勋把 Token 的消耗量称为 AI 时代的 GDP,这一度让 Token 这个概念风头无两。Token 是大模型处理文本的最小单位,每一次推理都要消耗 Token,而消耗 Token 需要算力,算力来自英伟达的 GPU。


奥特曼和黄仁勋表态后,各路大 V 纷纷跟风,纷纷以更多的 Token 消耗量自居,一些企业的 CEO,开始公开晒出公司的 Token 消耗量级,以标榜自己已经转型成为 AI Native 公司。


其核心的逻辑假设是这样的:使用 Token 越多,意味着驱动 AI 干了更多的事,创造的价值也就越多。


但如果往深了想一步,就会发现一个根本性的问题,Token 统计的是成本,不是产出。就像财务总监和老板汇报说,因为今年公司的支出翻了十倍,所以公司的业务蒸蒸日上。


这个逻辑显然不对,成本提升某些情况下上可以反映业务发展,但并不绝对,两者之间没有绝对的对应关系。


要理解这个问题,可以想想“生产”和“消费”这两个概念的真实含义。


所谓从事生产,意味着在链条里扮演的角色,会对外输出价值,比如创造了一件东西、完成了一个任务、把一个问题从有变成了没有。而使用别人的产品、阅读别人的产出,这些都是消费,客观上讲,一些看起来是在生产的动作,实际上也都是消费,比如“学习工作技巧”“上课培训”,这些虽然有意义,但都谈不上生产,因为一没有为链条贡献价值,二没有产生能在市场上售卖的资源。


Token 消耗量这个指标,恰恰就是统计这种消费:一个 Agent 烧了 100 万 Token 没有完成任务,另一个用 10 万 Token 交付了结果,在 Token 体系下,前者的数字更好看。


我甚至在社交媒体上看到很多帖子,公司把 Token 消耗量作为 KPI 考核指标,员工纷纷在社交媒体上求助,怎样才能浪费更多的 Token 工作,网友的建议是,让 AI 读一遍公司全部的代码库,再换种编程语言重写一遍,或者让 AI 直接翻译“二十四史”。


OpenAI 是卖 Token 的,英伟达是卖算力的,Token 消耗量当然能代表他们的收益,但对于更广大的 AI 应用层来说,Token 只能代表成本,不能代表价值。


二、DAA 是进步,但还缺一半刻度


说回百度李彦宏提出的 DAA 指标。


DAA 指标的诞生,有一个非常关键的前提,就是 Agent 时代正式来临。在当下,已经没有人看 AI 会不会聊天,而是更关注 AI 能不能干活。今年年初的 OpenClaw 龙虾热潮,把“AI 要有手和脚”凝聚成共识,随后的 Skill 风潮,让普通人也能低成本构建自己的 Agent。


围绕着 Agent,李彦宏给出了 DAA 的定义:不要数有多少人在用 AI,要数有多少智能体在替人干活、并且交付了结果。含义里有三层递进——主体是智能体,行为是“干活”,标准是“交付结果”。


单从这个定义看,一点没毛病,这个定义回到了业务发展的正确路线,用真正产生的价值来衡量收益。


但 DAA 这个指标本身,能否把这个含义表达清楚,存在两面性。


先说好的一面,DAA 真正进步的地方,是度量主体的跃迁。


互联网时代的 DAU,本质上是对于人的衡量,DAU 涨了,广告曝光多了,进而收入多了,不用关心用户进来干了什么。


DAA 把主体从“人”换成了“Agent”。这里面是一次认知范式的切换,它承认了 Agent 作为独立生产主体的地位,不再把它当作人类使用的工具,而是当作直接创造价值的单元来计量。从“有多少人打开了产品”到“有多少 Agent 在干活并交付结果”,竞争的焦点从流量获取转向了任务完成,这是一次真实的进步。


维度DAUDAA
价值主体Agent
衡量逻辑多少人打开了产品多少 Agent 在干活并交付结果
商业模式流量→广告任务完成→结果


但是 DAA 也有一个严重的不足,李彦宏没有讲,他的目的是度量价值结果,但是 DAA 这个指标本身,也只是衡量过程。


就用百度自己举的例子来说,青岛港通过 Agent,让本就全球领先的自动化码头调度系统 A-TOS 再次提效 10.21%。那么,按照 DAA 的逻辑,用 5 个 Agent 实现提效 10.21%,就比 3 个 Agent 提效 20%,表现更优,因为前者比后者多 2 个活跃。


这就是 DAA 这个指标根源的问题,它是一个存在性指标,不是一个绩效型指标。


制定过业务指标的人都知道,结果指标往下拆解,由许多过程指标咬合而成,销售部门的目标是赚多少钱,这是结果绩效型指标,往下拆是“电话转化率”“加微率”这种过程绩效型指标,再往下,才是“打了多少通电话”这种过程存在型指标。


DAA 只是衡量了有多少“Agent 在运行”,这其实和 Token 消耗量的逻辑有点类似,只要愿意,可以让无数个 Agent 消耗 Token,但仍不能回答“Agent 运行结果”的问题。


李彦宏说 DAA 关注的是“有多少智能体在替人干活、并且交付了结果”——但"交付结果"这四个字,在当前的 DAA 定义里没有操作化的路径,没有人知道怎么统一衡量它。


这是 DAA 没有回答的问题,是它与真正终极指标之间的另外一半距离。


三、百度为什么要提 DAA


DAA 虽有不足,但其主体变化的进步性,前面已经做了肯定。多想一步,百度为什么要在此刻提出 DAA 这个新指标?


在 Token 体系下,这是一场百度先天处于劣势的战争。算力,英伟达拥有最密集的产能,国内差距是明显的;基础大模型,百度文心模型起个大早赶个晚集,在大模型领域不仅无法和 Claude、GPT 打,甚至也没办法和国内的 DeepSeek、智谱打,如果整个 AI 时代的价值叙事,始终是“谁的模型更强、谁消耗了更多算力”,百度就永远是在别人划定的赛场上追赶。


百度提 DAA ,是想换一个维度,把竞争的核心从基础设施层转移到了应用生态层,百度相对稍有优势——这不是说百度的智能体生态已经领先——远没有,但重点在于,在这个维度上,百度至少有点真实的积累可以拿出来打一打,而不是在一个先天劣势的战场上原地追赶。


最终 DAA 这把尺子,能不能作为行业公认的标准,我谨慎观望,但是对多数 AI 应用公司和超级个体来说,DAA 开了一个认知窗口,指向了 AI 时代应该衡量什么,先让自己的 Agent 跑起来、很多个 Agent 同时跑起来、跑起来的同时拿到结果,这就是在当下这个跑马圈地的粗放阶段中,最佳的竞争姿态。


至于如何真正度量“Agent 产出的价值密度”,仍然是一个悬而未决的问题。谁能在这个问题上给出可操作、可量化的答案,谁才算是真正完成了这把尺子的下半截刻度。


本文来自微信公众号:产品变量,作者:亨亨

频道: 商业消费
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定