本文来自微信公众号: 硅星GenAI ,作者:大模型机动组
2026年3月16日,黄仁勋站在GTC大会的聚光灯下,抛出了一句让全场寂静的话:
"我能完全想象,未来英伟达每一位工程师都将拥有年度Token预算。他们的基础年薪可能是几十万美元,我会在此基础上再给出大约一半金额的Token额度——这样他们的产出就能被放大10倍。"
全场掌声。硅谷媒体争相转发。第二天,国内大厂HR开始讨论"我们要不要跟进"。
但就在同一周,TechCrunch发出了一篇泼冷水的文章,标题直接了当:《AI Token是新的签约奖金,还是只是经营成本的转移?》。一位斯坦福MBA、前风险投资人、现任CFO的Jamaal Glenn说了一句话,把这场福利狂欢戳破了一个洞:
"你的Token预算不会升值,不会计入下次谈薪,也不会在你跳槽时被算进去。"
这场全球同步上演的"Token入薪"运动,到底是谁的好事。
一、黄仁勋画的这张饼,有多大

先把这张饼的真实尺寸摆出来,因为它确实很大。
3月16日,黄仁勋在英伟达GTC年度大会上,系统阐述了他对AI时代工程师薪酬的完整设想。核心逻辑是:Token是AI时代的"燃料",就像工厂要用电、矿工要用炸药,工程师要用Token。一个不烧Token的工程师,相当于一个用纸和铅笔设计芯片的工程师——不是在省钱,是在浪费自己。
他的具体设想是这样的:英伟达一位年薪30万美元的工程师,未来将在基础年薪之上,额外获得约15万美元的Token额度。年薪50万的,额外获得约25万。按行业基准价格换算,15万美元的Token额度意味着可以全年不间断地运行自主AI智能体,同时处理数十个并行任务——相当于雇了一支不需要工资的虚拟军队。
在GTC之后,黄仁勋又在All-In Podcast上加了一句更有压迫感的补充:
"如果一个年薪50万美元的工程师,年底告诉我他只用了5000美元的Token,我会非常抓狂。"
潜台词很清晰:Token额度是资源,不烧完等于工作不饱和,工作不饱和等于你的产出不配你的薪水。黄仁勋还预测,Token将很快成为硅谷招聘的核心谈判筹码,"就像股票期权曾经是的那样"。
这套叙事有内在逻辑,也有真实数据支撑:根据英伟达财报,其2026财年全年营收达到2159亿美元,同比增长65%,数据中心营收单季增长75%。算力需求是真实的,不是虚构的。
但"需求是真实的"和"把它装进薪资包是合理的",是两件不同的事。
二、国内大厂:我们已经干了
黄仁勋讲完,国内已经不需要跟进了——因为国内大厂早就先行一步。
36氪的报道揭露了一个细节:2026年春天,国内头部互联网企业的薪酬结构已经悄然生变,Token正在被纳入年包与绩效激励体系。
腾讯为每名员工发放了价值22万元人民币的Token套餐。阿里的路径略有不同——员工可以免费调用悟空、Qoder等内部付费AI工具,购买百炼Coding Plan或外部合规AI开发工具的费用也可报销;另有部分公司更进一步,直接将Token使用量与年终奖和绩效挂钩,个人用了多少、产出了什么,成为可量化的绩效指标。
与此同时,国内云厂商也在2026年春天密集推出面向开发者的Coding Plan订阅套餐——阿里云百炼首月7.9元、火山方舟(字节)首月8.91元、腾讯云Lite套餐40元/月,这场价格战的本质,是各家在抢占"成为企业AI基础设施供应商"的战略高地。
知乎上有一篇开发者感慨:"OpenClaw火了,但13小时烧掉200美元的账单让所有人清醒了。"
Coding Plan就是这个清醒时刻诞生的产物:用固定月费,消灭按Token计费的"账单焦虑"。从员工福利的角度,它看起来相当慷慨。从商业逻辑的角度,它的设计者们显然想清楚了另外一件事。
三、Token排行榜:当算力消耗变成KPI
当Token成为薪酬的一部分,它不可避免地成为一种考核工具。
纽约时报在同期做了一篇深度调查,发现了一个此前几乎没有公开报道过的现象:在Meta、OpenAI、Anthropic等顶级AI公司内部,已经出现了"Token消耗排行榜"。工程师们在上面公开比拼谁烧了最多算力。
2026年春天,OpenAI有一位工程师在单周内消耗了2100亿Token,这个数字相当于33本完整的维基百科——它迅速成为公司内部的荣誉勋章。Anthropic有用户单月在Claude Code上消耗超过15万美元的Token。一位在斯德哥尔摩工作的爱立信工程师告诉《纽约时报》,他在Claude上的消耗可能超过了他的薪资,"幸好公司买单"。
Meta和Shopify的员工绩效评估中,AI使用量已经成为正式指标之一。高Token消耗的员工获得赞美、奖金和更快的晋升。低消耗的员工,则开始被贴上"效率不足"的标签。
这就是TechCrunch所说的"Tokenmaxxing"——一种以最大化Token消耗为目标的工作方式,它有时能真正提升产出,有时只是在用昂贵的算力表演忙碌。
更值得警惕的是这套逻辑的推导终点:一个公司如果为每位工程师支付了相当于第二个工程师薪资的Token费用,它的财务部门迟早会问一个问题——如果算力能干这么多活,我们真的还需要那么多人来协调它吗?
四、TechCrunch的那个刺眼问题
TechCrunch这篇文章,是目前英文媒体中对"Token入薪"最系统的质疑。
它的核心论点可以归结为三点:
第一,Token预算不是真正的资产。股票期权会升值,现金会复利,Token只有使用权没有持有权。你烧完了就没了,明年还要重新授予。前风险投资人、现任CFO的Jamaal Glenn说得更直接:"Token预算不会出现在你下次谈薪的offer信里,不会在你简历上留下痕迹,不会成为你跳槽时讨价还价的筹码。如果公司成功地把Token正常化为薪资的一部分,他们就可以在现金和股权不动的情况下,用一个不断膨胀的'算力额度'宣称他们在持续投资你这个人。这对公司来说是笔划算的买卖。"
第二,高Token配额自带高产出预期。一位TechCrunch引用的分析指出,当公司为你支付了相当于"第二个工程师"的Token费用,心理压力不是被鼓励,而是隐性的翻倍要求。你必须以两倍的速度产出,才能不让这笔账显得亏本。这不是更多资源,这是更高的隐性绩效门槛。
第三,Token的实际价值不稳定。不同于固定工资,Token的价格会随API定价波动。OpenAI历史上多次下调API单价,对用户是好事,但也意味着公司发出去的"25万美元Token额度"可能一年后只剩下10万美元的实际购买力——而公司账面上依然可以称之为"25万的福利"。
文章最后提了一个比较历史的类比:上世纪90年代末科技泡沫期间,大批工程师接受了大量股票期权作为薪酬的替代,泡沫破裂之后,期权一文不值。
Token的"泡沫时刻"会来吗?没人知道。但这个问题值得在签offer的时候想清楚。
五、黄仁勋的算盘:这是一门生意
现在来说那本最重要的账。
TechCrunch和所有质疑者讲的,是"Token入薪对员工是否划算"。但有一个维度几乎没有人正面说穿:这对英伟达是一门什么生意。
黄仁勋在GTC上宣布Token补贴的同一周,英伟达公布了截至2027年的订单预测——Blackwell和Vera Rubin系列芯片,合计订单规模预计超过1万亿美元。他在All-In Podcast上被主持人问到,"你现在一年在Token上给工程师团队花多少钱",黄仁勋的答案是:"我们在努力达到20亿美元。"
这就是那本算盘最清晰的一页。
每一个被"Token入薪"概念说服、跟进落地的科技公司,都在成为英伟达的算力消费者。每一个"鼓励工程师多烧Token才算努力工作"的企业文化规范,都在把推动GPU采购变成了HR的职责。黄仁勋推动Token成为"行业第四薪资支柱",本质上是在让整个科技行业的薪酬体系为英伟达的硬件销售持续背书。
这不是阴谋论,这是一个公开的商业逻辑——和当年苹果为开发者提供免费分发渠道、以换取AppStore 30%分成的逻辑,并无本质差别。
还有一个数据值得放在一起看:英伟达目前控制着全球AI芯片市场约80%的份额。一旦"Token消耗量等于工作投入度"的文化在行业内成为惯例,英伟达就不再只是供应商,而是成了这套劳动评价体系的底层基础设施提供者。
这是黄仁勋的GTC演讲中最聪明的部分,也是最少被媒体正面讨论的部分。
六、那国内呢?
国内大厂发Token福利的逻辑和英伟达有一个重要区别:他们发的主要是自家平台的Token,而不是英伟达的GPU算力。
腾讯的22万Token套餐走的是混元系大模型生态;阿里的百炼Coding Plan捆绑的是千问系列;字节的火山方舟Coding Plan则在自研豆包模型之外,聚合了DeepSeek、Kimi、GLM等多家模型,主打"模型超市"。他们做的,是英伟达那本账的国内版:用Token福利绑定开发者生态,同时把企业用量锁定在自家算力平台上。
从这个角度看,"Token入薪"这个概念,无论在哪里落地,都遵循着同一套底层逻辑:发出去的是算力,收回来的是生态绑定和用量数据。
员工和工程师是这个生态中的消费节点,也是被这套逻辑最直接作用的对象。他们获得了真实的生产力工具,也同时被卷入了一场关于"产出预期、绩效衡量和薪酬结构"的重新谈判。
而这场谈判,目前来看,主导权在发饼的一方。
写在最后
这是2026年最值得持续追踪的职场现象之一。
对工程师来说,Token福利是真实的生产力杠杆——但要在谈薪时认清它的局限性。它不是股权,不会升值,不会跟随你离职,也不是基础薪资被压低的理由。
对创业者和HR来说,如果要引入类似机制,最重要的问题不是"发多少",而是"用什么来衡量Token烧得值不值"——烧得多不等于产出多,这是Tokenmaxxing排行榜已经开始暴露出的问题。
对行业观察者来说,值得盯住的是英伟达接下来怎么把这套文化叙事制度化。如果"Token消耗量"真的进入招聘JD、绩效评估体系、乃至劳动合同,那它就不再是一场CEO的演讲,而是一场真正的劳动关系变革——只不过发起者穿着一件皮夹克,站在聚光灯下,把它叫做"生产力革命"。
最后,用TechCrunch的那句话收尾:
"也许Token真的会成为工程师薪资的第四支柱。但工程师们可能需要在全盘接受这个概念之前,先站稳立场想清楚。"
参考来源:Jensen Huang@GTC2026&All-In Podcast/TechCrunch/NYT Tokenmaxxing报道/36氪《Token额度算入年薪》
