多家科技企业因盲目“词元最大化”浪费算力却无匹配产出,纷纷关停内部词元跟踪榜单,呼吁企业AI考核转向成果导向。 ## 1. 词元跟踪榜单设立初衷与失控乱象 最初,Token消耗被视作衡量科技企业AI应用活跃度、技术投入规模乃至创新能力的指标,亚马逊推出内部Kirorank榜单,初衷是推动AI在业务场景的应用。 但部分员工为追求排名绩效,将AI当作不计成本的“烧Token”工具,造成大量算力资源浪费,形成“词元最大化”的畸形实践——盲目将Token消耗量与AI创新能力划等号,追求使用量最大化。 ## 2. 企业“烧Token”投入产出严重失衡的实际案例 企业管理平台Jellyfish研究显示:Claude Code高频使用者人均每周词元消耗量达2.25亿,是普通软件工程师(3200万)的7倍左右;使用率前10%的用户Token消耗量约为普通开发者的十倍,但产出仅为后者两倍。 除亚马逊外,Meta也推出过类似的“Claudeonomics”词元消耗榜单,数据显示Meta员工30天内消耗60.2万亿个Token,按Anthropic公开API价格计算约合9亿美元,榜单顶端从业者产出多为“一次性垃圾”,Meta随后也关停了该榜单。 Uber截至今年4月已耗尽年度Claude Code预算,却未看到与AI投入增加相匹配的生产力提升;OpenAI首席执行官奥尔特曼也公开质疑,不少企业AI支出不断增加,却未见到对应收入与生产力提升。 ## 3. 词元最大化的不同态度与行业优化建议 美国创业孵化器Y Combinator首席执行官Garry Tan是词元最大化的支持者,称其机构践行词元最大化的时间早于多数企业。 Jellyfish在研究报告中建议,企业管理者应关注单次代码合并请求成本这类以成果为导向的指标,而非单纯统计词元总消耗量。 该机构指出,大量使用AI确实能提升效率,但效果存在边际上限,最优路径是大范围推广AI应用,引导更多工程师进入中等合理使用区间,避免AI使用不足或过度消耗资源。
亚马逊:关停词元跟踪榜单
2026-05-31 11:48

亚马逊:关停词元跟踪榜单

本文来自微信公众号: 财联社 ,作者:张真


过去一段时间里,“词元(Token)”消耗的多寡常被视作衡量一家科技公司AI应用活跃度、技术投入规模,乃至创新能力的指标。如今,这一共识正在悄然瓦解。


据Business Insider等媒体报道,亚马逊在本周通知员工,旗下“Kirorank”榜单已停止服务。该榜单由内部开发者制作,可用于跟踪员工的Token消耗情况,其设立初衷是推动AI在业务场景的应用。然而事与愿违,部分员工为追求更高的排名和绩效,将AI智能体当作不计成本的“烧Token”工具,导致公司算力资源被浪费。


为此,亚马逊高级副总裁戴夫·特雷德韦尔(Dave Treadwell)劝诫员工:“请不要为了用AI而用AI。”


在他看来,亚马逊可以自主决定如何使用AI工具以及如何追踪其使用情况。虽然这家科技巨头确实会追踪Token的消耗情况以衡量算力成本,但它并不鼓励“词元最大化(Token Maxxing)”——一种将Token消耗量与AI创新能力在一定程度上划等号,并据此盲目追求Token使用量最大化的实践理念。


比起“烧Token”的行为本身,真正让巨头们感到焦虑的,是看不到Token消耗带来的业务和财务回报。


企业管理平台Jellyfish的最新研究显示,Claude Code高频使用者人均每周词元消耗量高达2.25亿,而普通软件工程师周消耗量仅为3200万。Claude Code使用率前10%的用户消耗的Token数量约为普通开发者的十倍,但产出成果仅为后者的两倍。


Meta内部有一个与亚马逊类似的“Claudeonomics”榜单,数据显示,Meta员工30天内消耗了60.2万亿个token。按Anthropic的API公开价格算,这笔账单约9亿美元。一位内部人士直言,排行榜顶端那些人,产出的东西基本都是“一次性垃圾”。随后,Meta同样关停了该榜单。


Uber首席运营官安德鲁·麦克唐纳(Andrew Macdonald)最近表示,这家网约车巨头并未看到与其AI投入增加相匹配的生产力提升和其他方面的收益。此前,该公司首席技术官普拉文·尼帕利·纳加(Praveen Neppalli Naga)曾表示,截至4月份,该公司已耗尽了其年度Claude Code预算。


OpenAI首席执行官奥尔特曼则在最近一次线上活动中公开质疑:“我从各公司听到了很多好消息,但也有负面消息,比如‘我们的支出不断增加,人们感觉自己工作效率很高……但收入在哪里?实际的生产力提升在哪里?’”


另一方面,词元最大化也有其支持者。


美国著名创业孵化器Y Combinator首席执行官Garry Tan欣然接受了这个术语,他表示:“我们进行词元最大化的时间比大多数人都要长。”


Jellyfish则在报告中建议,企业管理者应关注以成果为导向的指标,如单次代码合并请求成本,而非单纯统计词元总消耗量。该机构强调,大量使用AI确实能提升效率,但效果存在边际上限。最优发展路径是大范围推广AI编程应用,让更多工程师进入中等合理使用区间,既避免AI使用不足,也杜绝过度消耗资源。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定