Uber在四个月内烧光了全年AI工具预算,揭示了当AI工具跨过“够用”门槛后,企业面临的核心挑战从“是否采用”转变为“如何控制用量”,这引发了对成本结构、管理方式和ROI评估的全新思考。 ## 1. 预算失控:AI采用率远超预期 - Uber在部署Claude Code四个月后,耗尽了2026年全年的AI工具预算,其95%的工程师月活使用率远超20%-40%的行业平均水平。 - 高达70%的提交代码由AI生成,工程师主要扮演审核角色,导致每位工程师每月产生500至2000美元的成本,按6000名工程师估算,四个月花费约2400万美元。 ## 2. 预测模型失灵:用量无天花板是主因 - 传统IT预算基于可预测的使用量,但AI工具的使用没有上限,工程师从编写函数到重构模块、补充测试的每一步都在消耗token。 - 即便如Uber这样拥有成熟财务团队的公司,其预测模型也出现了三倍的偏差,这表明所有规模更小的团队都可能以更惨烈的方式面临同样问题。 ## 3. “好用”的负债:成本结构被重塑 - 当AI工具跨过“够用”门槛后,企业的主要矛盾从“推广使用”变为“控制用量”,管理挑战从鼓励使用转向限制滥用。 - 高级工程师每年2.4万美元的AI工具成本已接近一些国家初级开发者的年薪,这重塑了行业对“一个工程师值多少钱”的定义。 ## 4. 行业困惑与利益冲突 - 硅谷出现了“tokenmaxxing”现象,将token消耗量视为生产力指标,导致AI厂商(希望多消耗)、企业(希望控成本)和工程师(觉得自己在创造价值)三方的激励完全错位。 - 一些公司开始设置用量上限等控制措施,但这与购买工具提升效率的初衷相悖,最终问题指向了由谁来为AI的“好用”买单。
大厂让程序员卷AI,4个月烧掉全年预算,CTO懵了
2026-05-11 19:10

大厂让程序员卷AI,4个月烧掉全年预算,CTO懵了

本文来自微信公众号: APPSO ,作者:APPSO ,头图来自:AI生成


2025年12月,Uber给工程师们部署了Claude Code。这不是什么大事,硅谷的科技公司,几乎每个季度都会往工程师的工具链里塞进新东西,更何况还是AI,降本增效的武器。


四个月后,Uber的CTO Praveen Neppalli Naga向管理层汇报了一个令人尴尬的情况:公司为2026年全年准备的AI工具预算,已经在今年的前四个月,全部花完了。


一、这数字不对劲


Uber内部的数据是这样的:95%的工程师每个月都在用AI编程工具。


这个数字本身就很离谱:企业软件的行业平均采用率大约在20%到40%之间。大多数工具真正的命运是IT部门发一封邮件,少数尝鲜者试用几天,然后它就安静地躺在某个被遗忘的浏览器标签页里,直到下一次资产清点。作为参考:微软花了三年时间才让Teams的日活突破公司员工总数的一半。



Uber的AI编程工具做到95%,只花了四个月,这不太对劲吧。


更关键的数字是第二个:70%的提交代码由AI生成。也就是说,在Uber的代码仓库里,每十行新代码中有七行是AI写的,工程师只负责审核、修改、提交。


第三个数字试图解释了钱去了哪里:每位工程师每月的AI工具成本在500到2000美元之间。按Uber大约6000名工程师粗算,即使取中位数1000美元,每月就是600万美元,四个月就是2400万。而Uber 2025年全年的研发支出是34亿美元,同比涨了9%,AI已经是最大的增量推手。


一位Hacker News上的工程师对照了自己的情况,去算这些数字:到底怎么能用到这个量级的?



他的困惑代表了整个行业的困惑,倒不是质疑AI有没有用,而是用到这个量级,就应该算算ROI了吧。


二、不是采购失败,是预测模型失败


传统的企业IT预算建立在一个基本假设上:工具的使用量是可预测的。你知道公司有多少人,知道每人每月大概用多少云存储、多少SaaS席位、多少API调用次数,算一下就能算出年度预算,误差也有,但通常可以控制在10%到20%以内。


AI编程工具打破了这个假设,原因很简单:传统工具的使用量有天花板。一个工程师一天最多写那么多代码,一个设计师一天最多出那么多稿,但AI工具的使用量没有天花板。



你让它写一个函数,发现效果不错,那就再写十个。写完十个发现还能重构,就让它把整个模块重构一遍。重构完发现测试也能写,那就把单元测试全补上。


每一步都是合理的,每一步都在创造价值,但每一步也都在烧token。


一位技术博主在分析Uber案例时写道:这是一家市值超过1000亿美元的公司,有成熟的财务团队,有完善的预算审批流程,预测模型照样偏差了三倍。那么,每一个比他们小的团队都会以同样的方式——或许是更惨烈的方式——崩溃。


三、当好用变成一种负债


反而呢,这让人想起了那句扎心冷笑话:AI没有铺开,是因为现阶段它的费用比人贵。


这句话乍看像是在说AI太贵,但细思它说的其实是另一件事:在某些场景下,一个工程师加上AI工具的综合成本,已经超过了直接多雇一个初级工程师的成本,初级员工的就业率侧面反映了一定问题。



这不是AI的失败,恰恰相反,这是AI成功得太彻底的结果。


早两年,科技行业关于AI的叙事一直是“AI还不够好”,模型会幻觉,代码会出错,上下文窗口太短,无法理解复杂的业务逻辑……即便到了今天,这些批评依然部分成立。


但Uber的故事揭示了硬币的另一面:当AI跨过“够用”的门槛之后,企业面对的不再是“要不要用”的问题,而是“怎么控制用量”的问题。


前者是一种战略决策,很显然,现在已经没有犹豫的空间了,开团秒跟吧。


而后者,则是一种全新的管理挑战。历史上,企业软件的主要矛盾一直是“推广”,花了大价钱弄出来的系统没人用,是CIO们的噩梦。所有的培训、激励、考核机制都在解决同一个问题:让员工多用一点。


现在AI的使用门槛不断降低,使用本身不需要培训,不需要激励,不需要任何推广手段,工程师自己就会用到停不下来,就促生了新的管理面向。


四、更大的问题


Uber不是唯一一个遇到这个问题的公司。在Reddit和Hacker News上,关于AI工具成本失控的讨论在过去几个月密集出现。很多公司的情况和Uber类似:预算是按保守估计做的,实际使用量远超预期。


Axios报道中有一个更惊人的视角。一位Nvidia深度学习部门的VP说:我团队的算力成本已经远远超过了员工工资。


围绕这个现象,硅谷发明了tokenmaxxing,它模仿了健身圈的“maxxing”构词法,意思是不计成本地大量消耗AI token,把token消耗量当成一种生产力指标,甚至一种身份标签。“你这个月烧了多少token”正在变成工程师之间的社交货币,就像前几年他们比较谁的GitHub commit更多一样。


在过去,一个科技公司最大的成本是人,现在最大的成本可能是喂养AI的token。这不是一个简单的成本结构变化,它会重塑整个行业对“一个工程师值多少钱”的定义。


如果一个高级工程师每月的AI工具成本是2000美元,一年就是2.4万美元,这已经接近一些国家初级开发者的全年工资。如果AI让这个高级工程师的产出翻了三倍,那这2.4万花得值。但如果AI只是多生成了很多不必要的代码,或者让工程师养成了“先让AI跑一跑”的习惯而不是自己思考,那这2.4万,称得上是某种浪费。


Ainvest的一篇分析指出,这种行为创造了一个奇怪的利益冲突:AI厂商希望企业烧更多token,因为他们按用量收费。企业希望控制成本,但又不想限制工程师的生产力。与此同时,工程师觉得自己在创造价值,不理解为什么要限制工具的使用,三方的激励完全错位。


一些公司已经开始采取措施。设置每月用量上限、要求先写需求文档再调用AI、用更轻量的模型处理简单任务。但这些场景吧,想象一下多少有点荒诞,你花钱买了一个提升效率的工具,然后又花精力限制大家使用它。


五、谁来买单?


Uber的CTO说公司需要“回到白板前面”重新规划AI预算,潜台词是,“我们之前画的那个模型估算错了”。


过去两年,关于AI的争论一直围绕着“AI能不能取代人类”,但Uber的故事提供了一个更现实、也更紧迫的问题:当AI足够好用的时候,谁来为这个“好用”买单?


工程师不会买单,因为他们觉得自己在提高效率。管理层不会买单,因为他们已经享受了70%的代码由AI生成的红利。AI厂商更不会买单,因为按量计费是他们的商业模式。


最后,大概率只有财务继续头疼,该怎么面对下一轮股东大会时更刁钻的提问。

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定