本文来自微信公众号: AI前线 ,作者:青和,原文标题:《一月烧掉5亿美元才醒悟:把 Token 当 KPI是AI转型里最贵的坑!亚马逊连夜撤下排行榜》
最近,越来越多公司发现:还没等到AI真正改造业务,Token账单先把自己给改造了。原来AI转型里最贵的坑,就是把Token的使用量当成了员工的KPI。
某公司的老板大手一挥,给全员开通Claude授权,却忘了设上限。一个月烧掉5亿美元,折合人民币30多亿。等财务反应过来,上亿美元的账单已经在路上。

5亿美元究竟是怎么烧的?扒开细节,发现其中有相当一大块,都是某些员工跑任务时,反复撞上报错,一遍遍手动点"重试"点出来的。
如果只是一家公司手滑,那叫倒霉。问题是,类似的“事故”一抓一大把。
Meta内部有人做了一个叫Claudeonomics(Claude经济学)的榜单,统计谁用AI用得最猛。30天里,全公司烧掉超过60万亿个Token,光“榜一大哥”一人就占了2810亿Token,将近50万美金/月。

Uber最早给5000名工程师配齐Claude Code,使用率几个月内猛冲,结果一季度刚过,CTO就叫苦不迭:2026全年的AI编程预算已提前烧光。
国内也不遑多让。在阿里云峰会上,米哈游技术负责人就提到,有员工为了做一个项目,搭了几十个Agent协作,一晚上烧掉200万人民币的Token。
Token账单为何会如此失控?
高盛今年5月的报告《Decoding the Agentic Economy》点破了真相:在Agentic模式下,模型由于需要不断进行“思考-检索-调用工具-重新读取完整上下文”的循环,其Token消耗量达到了普通问答模式的1000倍。
你以为它在思考,其实它也在烧钱。而模型公司、云厂商、芯片公司,更是心照不宣地把“多用AI、多烧Token”包装成了先进生产力的进步。
这时再看Anthropic单季度超百亿、估值破万亿美元的造富狂飙,老黄赢麻了的增长曲线,是不是就不难理解了?下游“事故性”烧掉的钱,转身就成了模型公司财报上实打实的进账。同一笔钱,两个视角:一个叫增长,一个叫事故。
亚马逊先动手了
烧掉几亿美元或许是个极端案例,但为了烧钱而烧钱的现象,早就成了科技大厂的通病。
直到亚马逊实在看不下去,第一个动了刀。
亚马逊内部曾有一个叫KiroRank的榜单,挂在自家的Kiro开发者平台上,按工程师消耗的Token量排名。
加上公司此前下了硬指标,要求八成以上员工每周必须用AI,榜单一出,员工纷纷开始Tokenmaxxing:派Agent去干根本没必要的活,把Token烧成排名,再把排名内化成职场安全感。

最后,亚马逊高级副总裁Dave Treadwell终于坐不住了,在内部大会上呼吁强调:不要为了用AI而用AI。
榜单随即被下线,新指标也换成了“normalised deployments(标准化部署量)”,衡量工程师到底有没有用AI交付出真正有用的代码,而不是单纯数你烧了多少Token。
作为云计算霸主,亚马逊当然信AI,但它也亲自证明了一件事:AI使用量这个指标,太容易被污染。
你统计Token,员工就会刷Token;你统计Prompt数,员工就会编Prompt;你暗示“不用AI就落后”,员工就会想办法证明自己没落后。
经济学里有个古德哈特定律:当一个指标变成目标,它就不再是一个好指标。
到了AI时代,这句话可以换一个说法:当Token成了KPI,它就不再是生产力指标,而是一张会自动膨胀的云账单。以前卷工时,现在卷Token;以前KPI注水,现在云账单注水。技术进步了,职场的底色一直没变。
亚马逊并不是唯一踩刹车的人。
Shopify已经把Token排行榜改成更中性的使用仪表盘,加上熔断机制。Duolingo曾经想把AI使用情况纳入绩效考核,后来撤回;微软也开始收缩部分外部AI编程工具授权。
你的成本:老黄的资产
那些已经烧掉的钱,并不会凭空消失。一家公司的失控,往往是另一家公司的报表。
看Anthropic,一季度收入48亿美元,预计二季度翻倍至109亿美元。这条曲线靠什么撑起来?不是普通用户闲聊,而是企业API、Claude Code以及无数公司内部那套“全员AI”“Agent先跑起来再说”的组织冲动。

再看卖铲子的英伟达,最新季度收入816亿美元,这不只是AI信仰,还是实打实的现金流。
现在你再看黄仁勋那句话,味道就变了。昨天他才在GTC Taipei上说,从产业角度看,Token已经成为资产和营收单位。这句话聪明之处就在于,它悄悄偷换了主语。
Token的消耗,在普通企业的账本上,明明是成本,是要被财务追着问“这钱花得值不值”的支出。
只有站在上游厂商的账本上,Token才确实是资产:Token越多,推理越多;推理越多,老黄的GPU、网络、液冷都得跟着卖。站在Anthropic的账本上也是资产:企业每多跑一轮Agent,最后都会变成它的营收和利润率。
但站在下游企业的账本上,Token首先是成本。成本不是不能花,但只有换回更短流程、更少返工、更强交付,才有资格叫资产。如果token只是为了排行榜和先进性的证明来烧钱,那不过是更贵的形式主义。
AI提效的战场,并不在Token榜单
当然,这并不是要回到保守主义,否则投资AI的价值。问题是,很多公司把AI落地理解得太浅了。
他们以为给员工开账号就是AI转型,以为使用率上去了就是组织进步,以为Token烧得多就是AI用得深。
率先投身这场“转型”的Uber COO,分享了激进之后的醒悟:我们的代码确实多交付了一些,但很难把它和“给用户做出了更有用的功能”划上等号。
这并非个例,代码分析公司GitClear扒了2.2亿行代码,发现用AI辅助后,写完两周内就得返工的代码,翻了9倍;复制粘贴的重复代码翻了8倍。很多时候,企业只是把人类低效的地方,换成了模型以更贵的方式低效一遍。

真正的AI组织提效,并不在Token榜单上,而发生在业务深处。企业AI落地最难的地方,不是给员工开账号,而是让模型穿透工作流。
这也是为什么现在OpenAI、Anthropic都在重金招募Forward-Deployed Engineer(前向部署工程师),深入客户内部去拆流程、理权限、做集成——因为他们也已经意识到,光是API层面的交付,根本落不了地。

上游公司当然会继续讲Token的故事,但那毕竟是别人的增长故事。普通企业如果不先把自己的业务问题、流程结构想清楚,就急着把别人的故事搬进自己的KPI,最后只会沦为别人财报里的配角。
你这一头的事故,就是那一头的营收。会烧Token并不算本事,能说清楚“这笔钱到底让组织哪里变好了”才算。
