企业AI转型中错将Token消耗设为KPI会导致成本失控，多家大厂已踩坑调整，企业落地AI需聚焦业务提效而非盲目冲Token用量。 ## 1. Token作为KPI引发多起企业超支事故多家国内外企业出现Token失控烧钱事故：某企业给全员开Claude授权未设上限，一月烧掉5亿美元；Meta全公司30天消耗超60万亿Token，榜首个人单月花费近50万美元；Uber提前花完2026全年AI编程预算；国内米哈游员工一晚上烧掉200万人民币Token。 ## 2. Agent模式和错误激励推高Token消耗 Agentic模式下，模型需要循环完成「思考-检索-调用工具-更新上下文」，Token消耗量是普通问答模式的1000倍。上游模型、云厂商将多烧Token包装成生产力进步，下游企业错将Token设为考核指标后，员工会主动刷Token冲排名，进一步推高不必要消耗。 ## 3. 多家科技大厂已经叫停Token导向考核亚马逊下线按Token消耗量排名的KiroRank榜单，将考核指标更换为「标准化部署量」，衡量AI交付的实际价值。Shopify将Token排行榜改为中性使用仪表盘并添加熔断机制，Duolingo撤回将AI使用纳入绩效考核的计划，微软也收缩了部分外部AI编程工具授权。 ## 4. AI落地价值不在Token量，而在业务提效上游厂商的Token消耗就是下游企业的成本，只有Token消耗转化为更短流程、更强交付时，才对企业产生价值。当前不少企业AI转型仅停留在开账号冲使用率，AI辅助产出的返工代码量是原来的9倍，并未真正提升业务价值。企业AI落地核心是让模型穿透业务工作流，需要聚焦实际业务问题而非盲目跟风冲Token指标。

2026-06-02 16:59

一月烧掉5亿美元才醒悟：把Token 当KPI是AI转型里最贵的坑，亚马逊连夜撤下排行榜

AI前线

速览

本文来自微信公众号： AI前线，作者：青和，原文标题：《一月烧掉5亿美元才醒悟：把 Token 当 KPI是AI转型里最贵的坑！亚马逊连夜撤下排行榜》

最近，越来越多公司发现：还没等到AI真正改造业务，Token账单先把自己给改造了。原来AI转型里最贵的坑，就是把Token的使用量当成了员工的KPI。

某公司的老板大手一挥，给全员开通Claude授权，却忘了设上限。一个月烧掉5亿美元，折合人民币30多亿。等财务反应过来，上亿美元的账单已经在路上。

5亿美元究竟是怎么烧的？扒开细节，发现其中有相当一大块，都是某些员工跑任务时，反复撞上报错，一遍遍手动点"重试"点出来的。

如果只是一家公司手滑，那叫倒霉。问题是，类似的“事故”一抓一大把。

Meta内部有人做了一个叫Claudeonomics（Claude经济学）的榜单，统计谁用AI用得最猛。30天里，全公司烧掉超过60万亿个Token，光“榜一大哥”一人就占了2810亿Token，将近50万美金/月。

Uber最早给5000名工程师配齐Claude Code，使用率几个月内猛冲，结果一季度刚过，CTO就叫苦不迭：2026全年的AI编程预算已提前烧光。

国内也不遑多让。在阿里云峰会上，米哈游技术负责人就提到，有员工为了做一个项目，搭了几十个Agent协作，一晚上烧掉200万人民币的Token。

Token账单为何会如此失控？

高盛今年5月的报告《Decoding the Agentic Economy》点破了真相：在Agentic模式下，模型由于需要不断进行“思考-检索-调用工具-重新读取完整上下文”的循环，其Token消耗量达到了普通问答模式的1000倍。

你以为它在思考，其实它也在烧钱。而模型公司、云厂商、芯片公司，更是心照不宣地把“多用AI、多烧Token”包装成了先进生产力的进步。

这时再看Anthropic单季度超百亿、估值破万亿美元的造富狂飙，老黄赢麻了的增长曲线，是不是就不难理解了？下游“事故性”烧掉的钱，转身就成了模型公司财报上实打实的进账。同一笔钱，两个视角：一个叫增长，一个叫事故。

亚马逊先动手了

烧掉几亿美元或许是个极端案例，但为了烧钱而烧钱的现象，早就成了科技大厂的通病。

直到亚马逊实在看不下去，第一个动了刀。

亚马逊内部曾有一个叫KiroRank的榜单，挂在自家的Kiro开发者平台上，按工程师消耗的Token量排名。

加上公司此前下了硬指标，要求八成以上员工每周必须用AI，榜单一出，员工纷纷开始Tokenmaxxing：派Agent去干根本没必要的活，把Token烧成排名，再把排名内化成职场安全感。

最后，亚马逊高级副总裁Dave Treadwell终于坐不住了，在内部大会上呼吁强调：不要为了用AI而用AI。

榜单随即被下线，新指标也换成了“normalised deployments（标准化部署量）”，衡量工程师到底有没有用AI交付出真正有用的代码，而不是单纯数你烧了多少Token。

作为云计算霸主，亚马逊当然信AI，但它也亲自证明了一件事：AI使用量这个指标，太容易被污染。

你统计Token，员工就会刷Token；你统计Prompt数，员工就会编Prompt；你暗示“不用AI就落后”，员工就会想办法证明自己没落后。

经济学里有个古德哈特定律：当一个指标变成目标，它就不再是一个好指标。

到了AI时代，这句话可以换一个说法：当Token成了KPI，它就不再是生产力指标，而是一张会自动膨胀的云账单。以前卷工时，现在卷Token；以前KPI注水，现在云账单注水。技术进步了，职场的底色一直没变。

亚马逊并不是唯一踩刹车的人。

Shopify已经把Token排行榜改成更中性的使用仪表盘，加上熔断机制。Duolingo曾经想把AI使用情况纳入绩效考核，后来撤回；微软也开始收缩部分外部AI编程工具授权。

你的成本：老黄的资产

那些已经烧掉的钱，并不会凭空消失。一家公司的失控，往往是另一家公司的报表。

看Anthropic，一季度收入48亿美元，预计二季度翻倍至109亿美元。这条曲线靠什么撑起来？不是普通用户闲聊，而是企业API、Claude Code以及无数公司内部那套“全员AI”“Agent先跑起来再说”的组织冲动。

再看卖铲子的英伟达，最新季度收入816亿美元，这不只是AI信仰，还是实打实的现金流。

现在你再看黄仁勋那句话，味道就变了。昨天他才在GTC Taipei上说，从产业角度看，Token已经成为资产和营收单位。这句话聪明之处就在于，它悄悄偷换了主语。

Token的消耗，在普通企业的账本上，明明是成本，是要被财务追着问“这钱花得值不值”的支出。

只有站在上游厂商的账本上，Token才确实是资产：Token越多，推理越多；推理越多，老黄的GPU、网络、液冷都得跟着卖。站在Anthropic的账本上也是资产：企业每多跑一轮Agent，最后都会变成它的营收和利润率。

但站在下游企业的账本上，Token首先是成本。成本不是不能花，但只有换回更短流程、更少返工、更强交付，才有资格叫资产。如果token只是为了排行榜和先进性的证明来烧钱，那不过是更贵的形式主义。

AI提效的战场，并不在Token榜单

当然，这并不是要回到保守主义，否则投资AI的价值。问题是，很多公司把AI落地理解得太浅了。

他们以为给员工开账号就是AI转型，以为使用率上去了就是组织进步，以为Token烧得多就是AI用得深。

率先投身这场“转型”的Uber COO，分享了激进之后的醒悟：我们的代码确实多交付了一些，但很难把它和“给用户做出了更有用的功能”划上等号。

这并非个例，代码分析公司GitClear扒了2.2亿行代码，发现用AI辅助后，写完两周内就得返工的代码，翻了9倍；复制粘贴的重复代码翻了8倍。很多时候，企业只是把人类低效的地方，换成了模型以更贵的方式低效一遍。

真正的AI组织提效，并不在Token榜单上，而发生在业务深处。企业AI落地最难的地方，不是给员工开账号，而是让模型穿透工作流。

这也是为什么现在OpenAI、Anthropic都在重金招募Forward-Deployed Engineer（前向部署工程师），深入客户内部去拆流程、理权限、做集成——因为他们也已经意识到，光是API层面的交付，根本落不了地。

上游公司当然会继续讲Token的故事，但那毕竟是别人的增长故事。普通企业如果不先把自己的业务问题、流程结构想清楚，就急着把别人的故事搬进自己的KPI，最后只会沦为别人财报里的配角。

你这一头的事故，就是那一头的营收。会烧Token并不算本事，能说清楚“这笔钱到底让组织哪里变好了”才算。

AI创投日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP