本文来自微信公众号: 新浪科技 ,作者:郑峻,原文标题:《一个月烧掉5亿美元Token!多家美国科技巨头紧急叫停,硅谷开始重新招人》,题图来自:AI生成
AI时代什么最贵?在经历了此前哄抢显卡和争夺人才的热潮之后,现在看来是算力,是Token成本。不仅普通企业只能省吃俭用,连科技巨头都没有余粮了。“Tokenmaxxing”迅速变成了一个笑话。
云服务公司Box CEO亚伦·莱维(Aaron Levie)表示,他近期参加了一场有众多顶级企业高管的晚宴,发现商界领袖们讨论最多的话题,不是宏观经济议题,而是他们企业的Token成本。
莱维所说的并不令人意外。Uber的CTO普拉文·内帕利·纳加(Praveen Neppalli Naga)上个月坦承:公司将Claude Code部署给约5000名工程师后,短短四个月内就将全年AI预算烧光殆尽,让他措手不及。
Uber高层的本意是推广工程师们普及AI工具,从这个角度来看,他们达到了目的。上个月Uber工程师的Claude Code月使用率已飙至95%。但高层并没有考虑到另一面,单个工程师每月产生的API成本高达500到2000美元。
面对着目瞪口呆的Token预算,即便是Uber这样市值1500亿美元的大企业都不得不紧急制定严苛的分级管理,限制员工的使用流量,像当年节省纸张一样精打细算着每一个Token的成本。
科技巨头都烧不起了
令人意外的是,收紧AI预算的不仅有Uber这样的中型企业,甚至还包括了微软和亚马逊的超级云计算巨头。
去年年底,微软最核心的Experiences and Devices部门——覆盖Windows、Microsoft 365、Outlook、Teams及Surface全线产品的核心工程团队——率先在内部大规模推行Claude Code。
虽然微软对外强调并没有将AI使用量纳入员工绩效考核体系,但他们内部却流传着一份开发部门负责人朱莉娅·刘松(Julia Liuson)的内部备忘录,称AI的使用“不再是可选项,而是每个岗位、每个级别的核心要求”。
但仅仅六个月后,这场实验就不得不被紧急叫停。这并不是因为效果不好,而是员工们用得太爽,用量太猛,才让IT部门猝不及防。就在本周,微软开始着手关闭大部分内部Claude Code授权。数以千计的工程师被强制迁移回微软自家的GitHub Copilot CLI,以便进行成本管控。
然而,更触目惊心的案例来自Axios本周的独家报道。一家科技巨头因为没有对员工的Claude许可证设置使用上限,在短短一个月内烧掉了5亿美元。这不是一个抽象的数字:5亿美元相当于许多中型科技公司的全年营收。
虽然报道没有实名,但外界普遍认为这说的是亚马逊,因为亚马逊此前在公司内部大力推行AI工具,并将开发者的AI使用量纳入内部排行榜考核,要求超过80%的开发者每周必须使用AI。
这套考核机制迅速催生了一个新词:Tokenmaxxing——专指员工为了刷高排行榜数据而人为制造无意义AI消耗的行为。亚马逊员工们用MeshClaw自动化那些根本不需要AI的日常任务,让AI智能体在后台空转,只为让自己的token消耗数字好看。
面对每个月高达5亿美元的天价Token账单,亚马逊高管最终意识到,员工大量使用AI是为了提升排名,而不是解决实际业务问题。

就在上周,亚马逊放弃了AI使用量考核,要求员工高效使用AI工具。一位亚马逊高管甚至告诫旗下员工,不要单纯地为了使用AI而使用AI。这种态度和此前形成了鲜明对比。
同样的刷Token闹剧也在Meta上演。Meta首席人力官贾内尔·盖尔(Janelle Gale)明确宣布,AI使用情况与业务影响力将从2026年起正式纳入绩效考核体系,顶尖员工的奖金上限将超过年薪的200%。

Meta甚至要求员工必须在办公电脑上安装一套软件,在详细追踪他们的AI使用情况的同时,也为AI自动化办公提供训练数据。Meta CTO安德鲁·博斯沃思(Andrew Bosworth)曾公开表示,目标是未来开发能够自主执行工作任务的AI代理。
博斯沃思表示,他最顶尖的工程师花在AI Token上的钱相当于自己的年薪,并以此作为生产力倍增的证据。在这套指挥棒下,Token消耗量从一个工程指标悄然蜕变为职场晋升的通货。
Meta内部甚至出现了一个名为“Claudeonomics”的非官方排行榜,追踪全公司约8.5万名用户的Token消耗量。结果在30天的统计窗口内,该排行榜显示的总使用量超过60万亿个Token。排行榜曝光两天后,因“内部数据遭外部获取”而紧急下线。
账单让企业瞬间清醒
这种烧不起Token的戏剧性局面似乎反转得太快。因为就在不久之前,科技企业还在纷纷鼓励旗下员工全面转型AI,为员工提供无限度的Token额度。
在今年3月的英伟达GTC期间,黄仁勋公开表示,计划为英伟达每一个员工提供每年50万美元的Token额度。黄仁勋甚至强调,如果哪个员工在年底前没有把这50万美元的Token额度用完,他甚至会感到“失望”,因为这意味着员工没有充分利用AI来重塑自己的工作方式。
在这场科技巨头争相向华尔街讲述AI转型故事的时候,Token消耗量被当成AI落地深度的代理指标。Token消耗得越多,就越证明AI渗透进了工作流。于是,消耗量本身成了目标,生产力反而成了附带品。
但现实情况是,将AI使用量纳入绩效考核只会带来毫无意义的Token浪费。根据美国软件智能平台Jellyfish的估算,在轻度使用AI的情况下,合并一次拉取请求的成本仅为0.28美元,但在重度使用AI的情况下,这一成本可能瞬间就会急剧飙升到89.32美元。Token消耗得更多了,但交付的产品并没有变多,只是带来了更大的账单。
科技媒体Axios用一个词精准概括了当下的企业AI困境:sticker shock——价格虚高综合征。那些曾经急于拥抱AI的企业,正在集体面对膨胀的IT成本、难以量化的生产力提升,以及员工日益滋长的怀疑情绪。
高盛最新预测显示,随着企业和消费者大规模采用AI智能体,到2030年全球Token消耗量可能增长24倍,达到每月120千万亿(Quadrillion)。这是一个令人眩晕的数字——但数字本身并不创造价值。研究公司Mavvrik的调查显示,85%的企业AI成本预测误差超过10%;84%的企业表示,AI支出已将公司毛利率压低了6个百分点以上。
Gartner的预测则让人彻底清醒:即便到2030年AI推理成本下降近90%,企业AI总账单也不会因此变得便宜。原因很简单——智能体工作流所消耗的token量,是普通单次对话的数百倍乃至数千倍;消费量的增长速度,完全足以淹没单价下降带来的红利。
“首席产品官们不应该把商品Token的通缩,误读为前沿推理能力的普惠化,”Gartner高级分析师威尔·萨默(Will Sommer)如此警告。
那些曾经以“打开AI、看看会发生什么”为策略的公司,正在补课——补那些本该在推广前就该建立的治理体系和成本管控机制。
Token账单正在倒逼企业重新思考一个最基本的问题:AI到底在为我解决什么问题?这个问题,在采购许可证之前就应该回答。现在,市场用账单替他们给出了答案。
Uber COO安德鲁·麦克唐纳(Andrew Macdonald)对此直言不讳:“AI成本越来越难以合理化。”这与他们CTO早先的表态形成了一组沉重的呼应:Uber的CEO甚至公开表示,他看不出极端的Token消耗量与真正交付有价值的产品之间存在任何明确的关联。
重新开始雇佣员工
虽然很多企业正在以“AI可以替代人工”为由推行裁员,但Token成本急剧上涨与AI回报低效已经让一些企业开始踩起了急刹车。
瑞典金融科技巨头Klarna曾是AI替代人工最激进的鼓吹者。2024年,该公司CEO塞巴斯蒂安·西米亚特科夫斯基(Sebastian Siemiatkowski)宣称AI“已经能胜任人类所有的工作”,并以此为由冻结招聘、裁减约1200名员工,员工总数从2022年的5500人骤降至3400人。
然而到了2026年初,Klarna开始悄然反转:重新启动人工客服招募,并亲口承认决策失误——“成本不幸成为过于主导的评估因素,结果是服务质量的下降”。AI的确快,但它不擅长处理愤怒客户、复杂纠纷和需要共情的场景。Klarna用一次耗资巨大的回头路,给整个行业立下了一块警示碑。
澳大利亚联邦银行(CBA)的案例同样典型。2025年7月,这家澳洲最大银行宣布用AI语音机器人替代45名客服员工,理由是AI已能自动处理大量简单来电。然而现实迅速打脸:机器人上线后,客服来电量不降反升,顾客投诉激增,剩余员工被迫大量加班,管理层甚至亲自下场接听客服热线。仅仅一个月后,联邦银行向被裁员工公开道歉并支付补偿,宣布撤回裁员决定,邀请这45人悉数返岗。澳大利亚金融业工会将此称为“一次巨大的胜利”。
这两起事件,折射出AI时代一个尚未被充分正视的结构性陷阱:企业在规划AI替代方案时,往往只算了“省下多少人工成本”,却漏算了AI失效后的善后成本——顾客流失、品牌受损、重新招募培训,以及向员工赔付补偿。
研究机构Orgvue和Forrester的联合调查显示,那些急于用AI替代人力的企业中,有55%事后表示后悔。Token可以很便宜,但用Token替代人所付出的隐性代价,往往远比账单上的数字昂贵得多。
这场反转来得比任何人预期的都快。从黄仁勋在GTC舞台上宣布“员工烧不完50万美元Token我会失望”,到亚马逊高管告诫员工“不要为了用AI而用AI”,前后不过几个月。硅谷对Token的态度,完成了一次180度的弧线。
但这并不意味着AI时代结束了,而是意味着它真正开始了。此前那个“大水漫灌”式的推广阶段,本质上是一场以算力浪费为代价的组织实验——企业用真金白银买单,用员工的时间陪跑,用客户的信任背书。现在账单摆上桌面,该算清楚的事终于到了要算的时候:哪些场景真的需要AI,哪些只是在为排行榜表演。
Gartner那句话值得所有决策者贴在办公室墙上:不要把Token的降价,误读为AI能力的普惠。真正的问题从来不是Token贵不贵,而是每一个被消耗掉的Token,究竟在为谁创造价值。
