美国科技巨头盲目推广AI导致巨额Token浪费、成本失控，部分企业尝试AI替代人工失误后重启招人，折射出AI落地需回归价值本质。 ## 1. 科技巨头Token成本全面失控多家美国科技巨头因无管控推广AI工具，出现了惊人的Token消耗：Uber给5000名工程师部署Claude Code后，四个月烧光全年AI预算，单个工程师月API成本达500-2000美元，被迫限制使用。微软内部推行六个月Claude Code后因用量超标紧急关停，数千工程师迁移回自家GitHub Copilot CLI管控成本。未设置使用上限的巨头单月烧掉5亿美元Token，外界普遍猜测为亚马逊——亚马逊此前将开发者AI使用量纳入考核催生“Tokenmaxxing”，员工靠AI空转刷排名，最终公司放弃考核要求高效使用。Meta追踪8.5万名用户Token消耗，30天总用量超60万亿，相关非官方排行榜曝光后紧急下线。 ## 2. 盲目考核催生无效AI消耗，企业陷入成本困境此前科技巨头将Token消耗量当作AI落地深度的指标，甚至鼓励员工透支额度：英伟达CEO黄仁勋曾计划给每位员工每年50万美元Token额度，称用不完会失望。将AI使用量绑定考核后，只带来了无效浪费：Jellyfish估算，重度使用AI处理一次合并拉取请求成本最高达89.32美元，是轻度使用的300倍以上，Token消耗激增但交付量未提升。高盛预测到2030年全球Token消耗量将增长24倍至每月120千万亿；Mavvrik调查显示85%的企业AI成本预测误差超10%，84%的企业称AI支出压低毛利率6个百分点以上。Gartner指出，即便2030年AI推理成本下降90%，智能体消耗量增长也会抵消降价红利，不要将Token通缩误读为AI能力普惠。 ## 3. AI替代人工试点翻车，硅谷重新开启招人不少企业此前以AI替代人工裁员，因隐性成本过高、服务质量下降纷纷反转：瑞典金融科技Klarna2024年宣称AI可胜任所有工作，裁员1200人，2026年初重新招募人工客服，承认错将成本作为核心评估因素导致服务下降，AI不擅长处理情绪化复杂纠纷。澳大利亚联邦银行2025年7月用AI替代45名客服，上线后来电量、投诉量激增，剩余员工强制加班，一个月后就召回全部被裁员工道歉赔偿。Orgvue和Forrester联合调查显示，55%急于用AI替代人力的企业事后后悔，企业规划AI替代时常漏算AI失效的善后成本：顾客流失、品牌受损、招聘赔付等，替代人力的隐性代价远高于Token账单。 ## 4. AI落地进入理性阶段，需回归价值创造此前大水漫灌式的AI推广本质是浪费算力的组织实验，天价Token账单倒逼企业补课成本管控，重新思考AI的实际价值。当前硅谷对AI的态度完成180度转向，并不代表AI时代结束，而是真正理性落地的开始，核心问题从来不是Token价格，而是每一分消耗是否创造实际价值。

2026-06-01 18:06

一个月烧掉5亿美元Token，多家美国科技巨头紧急叫停

新浪科技

本文来自微信公众号：新浪科技，作者：郑峻，原文标题：《一个月烧掉5亿美元Token！多家美国科技巨头紧急叫停，硅谷开始重新招人》，题图来自：AI生成

AI时代什么最贵？在经历了此前哄抢显卡和争夺人才的热潮之后，现在看来是算力，是Token成本。不仅普通企业只能省吃俭用，连科技巨头都没有余粮了。“Tokenmaxxing”迅速变成了一个笑话。

云服务公司Box CEO亚伦·莱维（Aaron Levie）表示，他近期参加了一场有众多顶级企业高管的晚宴，发现商界领袖们讨论最多的话题，不是宏观经济议题，而是他们企业的Token成本。

莱维所说的并不令人意外。Uber的CTO普拉文·内帕利·纳加（Praveen Neppalli Naga）上个月坦承：公司将Claude Code部署给约5000名工程师后，短短四个月内就将全年AI预算烧光殆尽，让他措手不及。

Uber高层的本意是推广工程师们普及AI工具，从这个角度来看，他们达到了目的。上个月Uber工程师的Claude Code月使用率已飙至95%。但高层并没有考虑到另一面，单个工程师每月产生的API成本高达500到2000美元。

面对着目瞪口呆的Token预算，即便是Uber这样市值1500亿美元的大企业都不得不紧急制定严苛的分级管理，限制员工的使用流量，像当年节省纸张一样精打细算着每一个Token的成本。

科技巨头都烧不起了

令人意外的是，收紧AI预算的不仅有Uber这样的中型企业，甚至还包括了微软和亚马逊的超级云计算巨头。

去年年底，微软最核心的Experiences and Devices部门——覆盖Windows、Microsoft 365、Outlook、Teams及Surface全线产品的核心工程团队——率先在内部大规模推行Claude Code。

虽然微软对外强调并没有将AI使用量纳入员工绩效考核体系，但他们内部却流传着一份开发部门负责人朱莉娅·刘松（Julia Liuson）的内部备忘录，称AI的使用“不再是可选项，而是每个岗位、每个级别的核心要求”。

但仅仅六个月后，这场实验就不得不被紧急叫停。这并不是因为效果不好，而是员工们用得太爽，用量太猛，才让IT部门猝不及防。就在本周，微软开始着手关闭大部分内部Claude Code授权。数以千计的工程师被强制迁移回微软自家的GitHub Copilot CLI，以便进行成本管控。

然而，更触目惊心的案例来自Axios本周的独家报道。一家科技巨头因为没有对员工的Claude许可证设置使用上限，在短短一个月内烧掉了5亿美元。这不是一个抽象的数字：5亿美元相当于许多中型科技公司的全年营收。

虽然报道没有实名，但外界普遍认为这说的是亚马逊，因为亚马逊此前在公司内部大力推行AI工具，并将开发者的AI使用量纳入内部排行榜考核，要求超过80%的开发者每周必须使用AI。

这套考核机制迅速催生了一个新词：Tokenmaxxing——专指员工为了刷高排行榜数据而人为制造无意义AI消耗的行为。亚马逊员工们用MeshClaw自动化那些根本不需要AI的日常任务，让AI智能体在后台空转，只为让自己的token消耗数字好看。

面对每个月高达5亿美元的天价Token账单，亚马逊高管最终意识到，员工大量使用AI是为了提升排名，而不是解决实际业务问题。

就在上周，亚马逊放弃了AI使用量考核，要求员工高效使用AI工具。一位亚马逊高管甚至告诫旗下员工，不要单纯地为了使用AI而使用AI。这种态度和此前形成了鲜明对比。

同样的刷Token闹剧也在Meta上演。Meta首席人力官贾内尔·盖尔（Janelle Gale）明确宣布，AI使用情况与业务影响力将从2026年起正式纳入绩效考核体系，顶尖员工的奖金上限将超过年薪的200%。

Meta甚至要求员工必须在办公电脑上安装一套软件，在详细追踪他们的AI使用情况的同时，也为AI自动化办公提供训练数据。Meta CTO安德鲁·博斯沃思（Andrew Bosworth）曾公开表示，目标是未来开发能够自主执行工作任务的AI代理。

博斯沃思表示，他最顶尖的工程师花在AI Token上的钱相当于自己的年薪，并以此作为生产力倍增的证据。在这套指挥棒下，Token消耗量从一个工程指标悄然蜕变为职场晋升的通货。

Meta内部甚至出现了一个名为“Claudeonomics”的非官方排行榜，追踪全公司约8.5万名用户的Token消耗量。结果在30天的统计窗口内，该排行榜显示的总使用量超过60万亿个Token。排行榜曝光两天后，因“内部数据遭外部获取”而紧急下线。

账单让企业瞬间清醒

这种烧不起Token的戏剧性局面似乎反转得太快。因为就在不久之前，科技企业还在纷纷鼓励旗下员工全面转型AI，为员工提供无限度的Token额度。

在今年3月的英伟达GTC期间，黄仁勋公开表示，计划为英伟达每一个员工提供每年50万美元的Token额度。黄仁勋甚至强调，如果哪个员工在年底前没有把这50万美元的Token额度用完，他甚至会感到“失望”，因为这意味着员工没有充分利用AI来重塑自己的工作方式。

在这场科技巨头争相向华尔街讲述AI转型故事的时候，Token消耗量被当成AI落地深度的代理指标。Token消耗得越多，就越证明AI渗透进了工作流。于是，消耗量本身成了目标，生产力反而成了附带品。

但现实情况是，将AI使用量纳入绩效考核只会带来毫无意义的Token浪费。根据美国软件智能平台Jellyfish的估算，在轻度使用AI的情况下，合并一次拉取请求的成本仅为0.28美元，但在重度使用AI的情况下，这一成本可能瞬间就会急剧飙升到89.32美元。Token消耗得更多了，但交付的产品并没有变多，只是带来了更大的账单。

科技媒体Axios用一个词精准概括了当下的企业AI困境：sticker shock——价格虚高综合征。那些曾经急于拥抱AI的企业，正在集体面对膨胀的IT成本、难以量化的生产力提升，以及员工日益滋长的怀疑情绪。

高盛最新预测显示，随着企业和消费者大规模采用AI智能体，到2030年全球Token消耗量可能增长24倍，达到每月120千万亿（Quadrillion）。这是一个令人眩晕的数字——但数字本身并不创造价值。研究公司Mavvrik的调查显示，85%的企业AI成本预测误差超过10%；84%的企业表示，AI支出已将公司毛利率压低了6个百分点以上。

Gartner的预测则让人彻底清醒：即便到2030年AI推理成本下降近90%，企业AI总账单也不会因此变得便宜。原因很简单——智能体工作流所消耗的token量，是普通单次对话的数百倍乃至数千倍；消费量的增长速度，完全足以淹没单价下降带来的红利。

“首席产品官们不应该把商品Token的通缩，误读为前沿推理能力的普惠化，”Gartner高级分析师威尔·萨默（Will Sommer）如此警告。

那些曾经以“打开AI、看看会发生什么”为策略的公司，正在补课——补那些本该在推广前就该建立的治理体系和成本管控机制。

Token账单正在倒逼企业重新思考一个最基本的问题：AI到底在为我解决什么问题？这个问题，在采购许可证之前就应该回答。现在，市场用账单替他们给出了答案。

Uber COO安德鲁·麦克唐纳（Andrew Macdonald）对此直言不讳：“AI成本越来越难以合理化。”这与他们CTO早先的表态形成了一组沉重的呼应：Uber的CEO甚至公开表示，他看不出极端的Token消耗量与真正交付有价值的产品之间存在任何明确的关联。

重新开始雇佣员工

虽然很多企业正在以“AI可以替代人工”为由推行裁员，但Token成本急剧上涨与AI回报低效已经让一些企业开始踩起了急刹车。

瑞典金融科技巨头Klarna曾是AI替代人工最激进的鼓吹者。2024年，该公司CEO塞巴斯蒂安·西米亚特科夫斯基（Sebastian Siemiatkowski）宣称AI“已经能胜任人类所有的工作”，并以此为由冻结招聘、裁减约1200名员工，员工总数从2022年的5500人骤降至3400人。

然而到了2026年初，Klarna开始悄然反转：重新启动人工客服招募，并亲口承认决策失误——“成本不幸成为过于主导的评估因素，结果是服务质量的下降”。AI的确快，但它不擅长处理愤怒客户、复杂纠纷和需要共情的场景。Klarna用一次耗资巨大的回头路，给整个行业立下了一块警示碑。

澳大利亚联邦银行（CBA）的案例同样典型。2025年7月，这家澳洲最大银行宣布用AI语音机器人替代45名客服员工，理由是AI已能自动处理大量简单来电。然而现实迅速打脸：机器人上线后，客服来电量不降反升，顾客投诉激增，剩余员工被迫大量加班，管理层甚至亲自下场接听客服热线。仅仅一个月后，联邦银行向被裁员工公开道歉并支付补偿，宣布撤回裁员决定，邀请这45人悉数返岗。澳大利亚金融业工会将此称为“一次巨大的胜利”。

这两起事件，折射出AI时代一个尚未被充分正视的结构性陷阱：企业在规划AI替代方案时，往往只算了“省下多少人工成本”，却漏算了AI失效后的善后成本——顾客流失、品牌受损、重新招募培训，以及向员工赔付补偿。

研究机构Orgvue和Forrester的联合调查显示，那些急于用AI替代人力的企业中，有55%事后表示后悔。Token可以很便宜，但用Token替代人所付出的隐性代价，往往远比账单上的数字昂贵得多。

这场反转来得比任何人预期的都快。从黄仁勋在GTC舞台上宣布“员工烧不完50万美元Token我会失望”，到亚马逊高管告诫员工“不要为了用AI而用AI”，前后不过几个月。硅谷对Token的态度，完成了一次180度的弧线。

但这并不意味着AI时代结束了，而是意味着它真正开始了。此前那个“大水漫灌”式的推广阶段，本质上是一场以算力浪费为代价的组织实验——企业用真金白银买单，用员工的时间陪跑，用客户的信任背书。现在账单摆上桌面，该算清楚的事终于到了要算的时候：哪些场景真的需要AI，哪些只是在为排行榜表演。

Gartner那句话值得所有决策者贴在办公室墙上：不要把Token的降价，误读为AI能力的普惠。真正的问题从来不是Token贵不贵，而是每一个被消耗掉的Token，究竟在为谁创造价值。

AI原生产品日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定