本文探讨大厂盲目烧Token的AI泡沫,指出token消耗未转化为实际价值,最终养肥了产业链上游厂商。 ## 1. 高管质疑烧Token未产生对应价值 Uber运营负责人Andrew Macdonald公开质疑Token高额消耗的合理性,指出**更高的Token使用量,并未转化为同等比例的有用消费者功能增长**,无法建立消耗与价值的直接关联。 为对冲AI投入,Uber已放缓招聘;米哈游内部测试多Agent协作时,一夜烧掉价值200万元人民币的Token,该投入并未产生显著可见价值,米哈游计划未来三年最多投入1000亿元深耕AI领域。 ## 2. 多家企业已开始调整Token管理策略 多邻国撤回了将AI使用纳入绩效考核的规则,明确绩效考核核心是实际工作成果,不强制要求为了形式使用AI。 Shopify将鼓励冲量的「Token排行榜」更名为「使用情况仪表盘」,新增熔断机制管控突发Token消耗,同时核查高消耗的实际使用场景,转变为关注生成Token的价值而非消耗总量,已发现多起失控Agent与基础设施bug。 ## 3. Token消耗潮的受益与受损方清晰分化 Tokenmaxxing本质是将企业AI使用从「按需调用」转为「鼓励消耗」,**第一受益方是OpenAI、Anthropic等基础模型厂商,直接放大了API调用与订阅收入,Anthropic预计2026年二季度销售额超109亿美元,远高于一季度的48亿美元**。 第二受益方是Cursor等AI编程与Agent平台,这类平台目前是流量与估值赢家,年化收入已超10亿美元,但多数尚未盈利;最大受益方是英伟达、云厂商等AI基础设施方,英伟达2027财年一季度收入达816亿美元,同比增长85%。 最终输家是无法将Token消耗转化为资产、仍盲目追风的企业。 ## 4. 行业已出现盲目追风的Token浪费乱象 Meta、微软、Salesforce等多家大厂都存在无意义的Token消耗:Meta内部大量Agent消耗海量Token却无有效产出,因舆论争议下线了Token排行榜;微软员工为证明自身「AI原生」主动消耗无意义Token;Salesforce强制设定最低Token消耗额度,员工主动刷量凑数。 创业孵化器YC已将Tokenmaxxing包装为AI原生创业方法论,建议创业者接受高API账单替代人力成本,但**无治理的高额Token消耗很可能拖垮抗风险能力弱的早期创业公司**。 ## 5. Tokenmaxxing本质是AI转型焦虑税 Tokenmaxxing是企业在AI转型焦虑下,误将「Token消耗」等同于「生产力提升」,把Token使用量包装为组织先进性的指标。 在未验证Token消耗能否带来更快交付、更高收入等实际价值的情况下,无脑烧Token本质就是企业缴纳的昂贵「转型焦虑税」。
米哈游一夜烧掉200万元Token,大厂高管也开始质疑:Token烧不出价值,但养肥了谁?
2026-05-26 16:44

米哈游一夜烧掉200万元Token,大厂高管也开始质疑:Token烧不出价值,但养肥了谁?

本文来自微信公众号: AI前线 ,作者:褚杏娟


终于有高管站出来,用自己的实际经验直接质疑tokenmaxxing成本问题了。


Uber运营负责人Andrew Macdonald在近期的访谈中直接表示,公司内部越来越难证明AI tokenmaxxing成本是合理的。


此前,Uber首席技术官Praveen Neppalli Naga曾在4月份时透露,Uber已经提前用完了2026年的Claude Code预算。这番话随后在网上引发热议。Macdonald形容自己那一刻像是“脑袋炸开了”,公司内部也开启了一场关于token消耗的讨论,以及这种消耗所带来的取舍,比如是否会影响员工人数。


根据与Uber高级工程管理层的交流,Macdonald意识到:更高的token使用量,并没有转化为同等比例的、有用的消费者功能增长。


“这中间的联系还没有建立起来,对吧?”他说道,“我觉得也许从隐性层面看,确实有更多东西被交付出来了,但很难在这些数据和‘好,现在我们真的多产出了25%的有用消费者功能’之间画出一条清晰的线。”


Macdonald表示,由于无法建立直接联系,AI带来的取舍成本就更难被合理化。需要注意的是,本月早些时候,Uber CEO Dara Khosrowshahi在财报电话会上表示,为了对冲AI投入,公司正在放缓招聘。


Macdonald补充称,如果你只是“坐在那里想各种有趣用例的用户”,而且不用自己付钱,AI看起来确实像是免费的。但最终,账单是由公司来买单。


要tokenmaxxing?先问自己钱够吗


对于大公司来说,不用“Tokenmaxxing”,日常一次尝试就很烧钱了。


5月20日,《崩坏》系列AI NPC&Gameplay技术团队负责人郑银河在2026阿里云峰会上无意透露了内部对agent尝试的成本:有员工为了实现项目,建了几十个Agent共同协作,结果一晚上烧了价值200万人民币的Token。


“我们接受在探索AI时有成本、有学费,这也帮助更完善我们的Agent平台。”话虽如此,但有网友指出,这200万人民币的价值似乎并没有显著体现出来。


而这种“豪气”并非每个公司都能负担得起。就像有网友打趣道:“一单648才半个多金,两百万不过是三个全65氪佬养服的钱。”


值得注意的是,5月15日,米哈游联合创始人刘伟曾在外部活动中表示,未来三年,最多投入1000亿元以深耕AI领域。他坦言,“就算最终不成功,没做出来,也认了,就当放一场大烟花。”


“我们作为一个‘all in ai’口号的公司,在某一天用了十万块钱的token后,封掉了所有人的API。”有网友对此评论道。


已有公司开始调整


当大型科技公司还在大力推进所谓的“tokenmaxxing”时,一些公司已经开始往相反方向调整。


例如,多邻国此前曾决定把AI使用情况纳入绩效评估,但在员工提出疑问“他们是否只是为了使用AI而不得不用AI”后,公司撤回了这一做法。


多邻国CEO Luis von Ahn在4月的一期播客访谈中曾说道:


“多邻国确实曾把AI使用情况纳入绩效考核,但后来我们取消了。我给公司发过内部备忘录,说明绩效考核会包含AI使用情况,结果发现员工们会疑惑,“是不是为了用AI而用AI?”。最后我们收回了这个要求,因为绩效考核最重要的是把本职工作做到最好,AI很多时候能帮上忙,但没必要强制使用。我们不想让大家为了迎合形式而忽略实际工作成果,有些场景AI本身就不适用。”


还有像Shopify这样的公司开始想办法阻止失控的token消耗。


Shopify是较早尝试Token排行榜的公司之一。其工程负责人Farhan Thawar曾表示,公司会表扬使用Token最多的人,因为他们可能正在用AI做出有价值的工作。例如,一个月在Cursor上花费1000美元的开发者,可能背后已经建立了一支Agent员工队伍。


但Shopify后来将“Token排行榜”改名为“使用情况仪表盘”。原因是,公司不希望鼓励员工为了冲榜而竞争。Token花费仍会展示在内部个人资料页和使用仪表盘中,但重点从“排名”转向“理解使用情况”。


Shopify还设置了“熔断机制”。如果某个员工的个人花费在一天内突然激增,公司可以立刻切断访问权限。如果这次激增是有意为之,或确实是Agent失控,员工可以申请恢复。


Farhan表示,这套机制不仅帮助公司发现了失控Agent,也暴露出了基础设施中的bug。更重要的是,Shopify会关注高Token使用者到底在做什么。高支出员工会被询问具体使用场景,如果有人只是单纯刷Token,很可能会在这一过程中暴露出来。


Farhan还提出一个更有价值的角度:与其只看“谁花的钱最多”,不如看“谁生成的Token最贵”。一些高成本Token背后,往往对应更深入、更复杂的开发工作,这比单纯的总量排名更有参考价值。


Tokenmaxxing潮中的赢家们


Tokenmaxxing的本质是把企业内部AI使用从“按需调用”变成“鼓励消耗”。只要企业把token使用量当成先进性指标,模型厂商就获得了一个近乎完美的增长飞轮。


Tokenmaxxing最直接的受益方,是OpenAI、Anthropic、Google、xAI等基础模型厂商。


因为token本身就是模型调用的计费单位。企业一旦把token使用量变成内部排行榜或绩效信号,员工就会从“按需调用AI”转向“主动制造AI使用量”。这会直接放大模型API调用、企业订阅和推理收入。


Meta的案例最能说明这一点。Meta员工在30天内消耗了60.2万亿个AI token,如果按照Anthropic API价格计算,这笔成本可能高达9亿美元;即便Meta能拿到折扣,成本也可能超过1亿美元。


这意味着,Tokenmaxxing一旦在大型企业内部规模化,就不再是普通工具开销,而是上亿美元级别的推理账单。


Anthropic的收入增长也能反映这种趋势。Reuters最新报道称,Anthropic预计2026年第二季度销售额将超过109亿美元,高于第一季度的48亿美元,并有望实现5.59亿美元经营利润。此前报道,Anthropic的Claude Code在推出当年就接近10亿美元年化收入。


也就是说,对模型厂商而言,Tokenmaxxing本质上是在把企业内部焦虑转化为API收入。当然,这不意味着模型公司没有算力压力,但Tokenmaxxing至少给了他们很可观的收入。


第二类赢家,是Cursor、Claude Code、Windsurf、Replit、Lovable等AI编程工具和Agent平台。比如,Cursor背后的Anysphere在2025年11月完成新一轮融资,估值接近300亿美元;公司称其年化收入已经超过10亿美元,销售驱动收入自2025年初以来增长了100倍。


但这不代表AI工具类公司就能盈利。据外媒报道,Cursor、Windsurf等公司增长迅速、估值高企,但许多公司尚未盈利,原因之一是它们依赖Anthropic等基础模型,推理成本很高;一些公司因此开始训练自有模型,以降低成本和增强控制力。


所以,AI编程工具只能说是Tokenmaxxing的流量赢家和估值赢家,还不一定都是利润赢家。


Tokenmaxxing底层烧的是算力,最大的赢家还是英伟达、云厂商、GPU云服务商以及AI基础设施公司。


典型如英伟达,其财务数据已经体现了这种趋势。英伟达在2026财年(截至2026年1月)全年收入达2159亿美元,同比增长65%;第四财季收入681亿美元,同比增长73%。随后,在2026年4月结束的2027财年第一季度,收入进一步达到816亿美元,同比增长85%,其中数据中心业务和网络硬件是核心驱动力,网络销售额达到148亿美元、同比增长约三倍。


云和推理基础设施创业公司同样受益。AI基础架构新创公司Modal Labs在最新一轮融资后估值达到46.5亿美元,年化收入从去年9月的6000万美元增长到3亿美元。它的业务正好踩中两个趋势:AI coding需求暴涨和算力资源越来越稀缺。


而这场浪潮中,最大的输家还是那些无法把token消耗转化为资产、但还盲目追风的企业。


有钱大厂对token太“上头”


回头看,这场硅谷“token消耗战”中已经浪费了不少token,“上头”的更多还是有钱的大厂们。


多位Meta工程师表示,内部正在出现大量无意义的AI使用。一些开发者运行类似OpenClaw的内部Agent,消耗海量Token,却几乎没有产生有效成果。还有开发者提到,部分SEV线上事故疑似与粗心的AI代码生成有关:开发者更关注用AI快速产出大量代码,而不是产品质量本身。


更具争议的是,排行榜让Token使用变成了游戏化竞争。排在榜首的员工,未必做出了更有价值的工作,反而可能制造了大量一次性、可丢弃的代码和提示词记录。内部人员查看AI提示词轨迹后,可以清楚看到其中许多工作并没有实际意义。


在社交媒体上出现舆论反弹,以及外媒披露相关数据后,Meta下线了该排行榜。


微软、OpenAI、Anthropic等内部也存在类似的Token使用仪表盘。早期来看,这一机制确实推动了AI工具实验,但问题也随之出现:当Token使用量与绩效评价、晋升信号、AI原生程度挂钩后,它就不再只是一个观察指标,而会变成员工刻意追逐的目标。


有微软工程师承认,自己会主动进行Tokenmaxxing,不是为了冲榜,而是担心被认为“AI用得太少”。他会向AI提问文档里已经写明的问题;让AI生成自己根本不会开发的功能原型;即使明知道手写更快,也默认使用Agent,然后看着它失败。


这位工程师入职时间不长,对职业安全感较为敏感,因此选择通过消耗更多Token来证明自己是“够AI原生”的员工。


Salesforce的做法更激进,直接让员工之间对比token消耗。


根据一名内部工程师的说法,公司推出了两个工具:一个是Mac小组件,每15分钟更新一次个人花费,同时显示最低预期花费,曾有周Claude Code的目标是100美元,Cursor的目标是70美元;另一个是网页工具,可以查看任意同事的Token花费情况。


Salesforce还设置了Claude Code 250美元/每月、Cursor 170美元/每月的最高花费限制,但这一限制可以通过简单点击按钮接触。部分工程组织甚至移除了最高限制,理由是“消除开发流程中的任何摩擦”。


这传递给员工的信号很明确:每月至少要使用约170美元Token,否则可能被认为AI使用不足。


结果,员工开始为了达到最低线或略高于平均水平而主动燃烧Token。一些开发者会让Claude或Cursor生成与工作无关、也不会真正交付的项目;另一些人则查看同事的花费,计算出“略高于平均值”的安全区间,再把自己的Token用量刷到那个位置。


Tokenmaxxing甚至被推崇成创业方法论


然而,这个风气并未停止。YC正在把“Tokenmaxxing”从硅谷流行词推向创业公司方法论。


在最新一期《Startup School》中,合伙人Diana Hu向创业者提出,打造AI原生公司的关键转变,不是继续扩大员工规模,而是最大化AI token使用量。她直言:“最大化token使用,而不是最大化员工人数,将成为关键转变。最优秀的公司,会是那些tokenmaxxing的公司。”


Hu认为,AI正在改变创业公司的成本结构。过去一家前AI时代公司需要一支大型工程团队完成的工作,如今一个熟练使用AI工具的人就可能完成。她表示,这意味着工程、设计、人力资源和行政团队都可以变得更精简。


她进一步建议,创业者应当愿意承受“高到令人不舒服的API账单”,因为这笔支出替代的,是过去更昂贵、更臃肿的人力成本。这意味着,在YC的新创业观里,高额token账单不一定是浪费,反而可能是公司用AI替代组织膨胀的信号。


不过,这套建议是否真的适合早期创业公司呢?


如之前所说的,这些已经有不错用户的基础的AI编程公司都未能盈利,那新的创业公司在tokenmaxxing之后的成本又该如何负担呢?难道真要把股权“贱卖”给Altman,换200万美元的token先烧一个半月再说?


无限量、无治理、不可转嫁的token消耗,是会拖垮这些创业公司的。


结束语


Tokenmaxxing的本质,一定程度上,也是企业在AI转型焦虑下,把“消耗”误当成了“生产力”。


它把token使用量包装成AI原生程度,把AI原生程度包装成组织先进性。在更多token是否带来了更快交付、更少bug、更低事故率、更高收入和更可复用的能力等没有数据验证下,就无脑鼓励无尽烧token,更像是在缴纳一笔昂贵的“转型焦虑税”。


参考链接:


https://www.businessinsider.com/uber-coo-andrew-macdonald-ai-token-spending-harder-justify-2026-5


https://mp.weixin.qq.com/s/Xvoh9hGnqe7rJ_ns5tRwBQ


https://mp.weixin.qq.com/s/JaGOyQ20UOTKkrXkJ2AXBw


https://blog.pragmaticengineer.com/the-pulse-tokenmaxxing-as-a-weird-new-trend/?utm_source=chatgpt.com

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定