Token经济:谁在瓜分“小龙虾”带来的万亿红利?
2026-03-23 13:36

Token经济:谁在瓜分“小龙虾”带来的万亿红利?

本文来自微信公众号: 第一新声 ,作者:竹心


2026年3月的一个深夜,杭州西溪园区的一纸文件,让整个中国互联网圈彻夜无眠。


阿里巴巴宣布成立Alibaba Token Hub事业群,由CEO吴泳铭亲自挂帅。这是阿里继2023年“1+6+N”变革以来,首次设立与淘天、阿里云平起平坐的核心独立事业群。


没有人会为一个技术名词大动干戈——除非,这个名词代表着下一个万亿市场。


就在同一天,智谱悄然上调GLM-5-Turbo的API价格,涨幅83%。更早一周,优刻得因推出“小龙虾”相关服务,3个交易日暴涨超30%。而在大洋彼岸,英伟达刚刚交出一份震惊华尔街的财报:单季营收681亿美元,净利润429.6亿美元,毛利率75%。


每一项数字,都在刷新人类商业史的纪录。


这一切,都指向同一个源头:一只名为OpenClaw的“小龙虾”。


这个开源智能体项目,因其让AI从“能聊天”进化到“能干活”的能力而火爆全球——它可以像人类员工一样自主规划行程、编写代码、处理复杂任务。但鲜为人知的是,正是这只“小龙虾”,将AI的Token消耗量提升了1万倍,直接引爆了“Token通胀”。


当企业为“小龙虾”的智能而欢呼时,CTO们却在为月底飙升的云账单头疼。Token,这个曾经只属于技术圈层的术语,正变成企业核心的“运营成本”和“流通货币”。


黄仁勋在GTC 2026上的预言正在应验:未来的数据中心就是“生产Token的工厂”,算力越用越便宜,但Token的钱得一直交。一个围绕Token的完整经济生态已经成型。


谁在赚这笔钱?


当我们将产业链上每一个“捞金者”的财务数据和商业模式拼接在一起时,一个惊人的真相浮现出来——这不是一场技术竞赛,而是一场财富的重新分配。


01


算力霸主:英伟达的“Token经济学”白皮书


2026年3月,GTC大会的舞台上,黄仁勋做了一件让所有人意外的事。他没有像往常那样大谈芯片参数和制程工艺,而是展开了一张图。


Y轴是吞吐量——每兆瓦功耗产出多少Token;X轴是交互性——每个用户感知到的Token速度。他在X轴下面标了五个档位:Free用Qwen 3,0美元/百万Token;Medium用Kimi K2.5,3美元/百万Token;High用GPT MoE,6美元/百万Token;Premium用GPT MoE 400K上下文,45美元/百万Token;Ultra,150美元/百万Token。



这张图,几乎可以当作黄仁勋“Token经济学”的白皮书封面。他在预判一个市场结构,然后把自己的硬件产品线,精确地铺在这个结构的每一层上。


在Token经济的食物链中,英伟达处于最顶端。它不直接卖Token,但它垄断了生产Token的“生产线”和“操作系统”。


最新财报印证了这一地位。截至2026年1月25日的第四财季,英伟达营收681亿美元,同比增长73%;净利润429.6亿美元,同比增长94%。整个2026财年,英伟达营收2159亿美元,同比增长65%。单季429.6亿美元的净利润,足以超过全球90%以上国家的单季GDP——一家公司,富可敌国。


数据中心业务是绝对主力。第四季度数据中心营收623亿美元,同比增长75%,占公司总营收比重超过91%。自ChatGPT出现以来,英伟达数据中心业务收入增长近13倍。


更值得关注的是产能规模。过去四个季度,英伟达已出货600万颗Blackwell GPU。下一代Rubin平台已规划六款新芯片,与Blackwell相比可将推理Token成本降低最高10倍。



英伟达的赚钱模式,是将算力从“一次性资本支出”变成“持续性运营成本”。全球数亿块GPU都跑在CUDA上,每生成一个Token,都绕不开英伟达的底层架构。


这背后是物理定律制造的天然稀缺。一个1GW的数据中心永远不会变成2GW。土地、电力、散热——每一项都有物理上限。你花400亿美元建好的工厂,15年里能产出多少Token,完全取决于你往里面放了什么计算架构。而这种稀缺性,不能被任何人“分叉”。


02


发电厂:云厂商的“卖电”生意


云厂商买下英伟达的“生产线”,建成“发电厂”,然后把“电”和“供电服务”卖给客户。


优刻得是这一逻辑的典型代表。3月18日,优刻得宣布推出基于自身云安全与AI基础设施积累的OpenClaw云上安全加固方案。消息发布后,优刻得股价大涨,截至14时30分报47.47元/股,涨幅达13.59%。


在此之前,优刻得已于1月下旬率先推出了部署OpenClaw的相关镜像,为行业内率先实现云端部署的厂商,相关服务已上线美国、新加坡、日本等多个海外节点。此后,公司股票于3月6日、9日和10日连续三个交易日内收盘价格涨幅偏离值累计超过30%。


随着Token需求暴涨,云厂商不仅赚算力租赁的钱,还赚部署、运维的服务费,是这波通胀中最直接的受益者。



03


炼油厂:模型厂商的“分层定价”术


他们将底层的算力“原油”,提炼成可直接消费的“Token汽油”,并通过网络输送出去。


黄仁勋披露的Token分层定价体系揭示了这一层的盈利逻辑:基础层每百万Token 3-6美元,高速层45美元,顶级研究模型高达150美元。企业只要用AI,就得持续按量付费。


OpenAI的GPT-5.4定价体系印证了这一逻辑。基础版API输入每百万Token 2.50美元,输出15美元;专业版输入30美元,输出180美元——单价是基础版的十倍以上。当单次请求上下文长度突破272K阈值时,计费还将翻倍。


Anthropic则采取了不同的策略。其最新Claude Opus 4.6和Sonnet 4.6全面开放100万Token上下文窗口,且不再加收任何溢价。Opus 4.6百万Token输入输出价格分别为5美元和25美元,Sonnet 4.6则为3美元和15美元。在MRCR v2评测中,Opus 4.6以78.3%的分数位列同类模型第一。


国内玩家的表现同样亮眼。


2026年2月,MiniMax的年化经常性收入突破1.5亿美元,开放平台2月新注册用户数达到2025年12月的4倍以上。M2系列文本模型2月日均Token消耗量较去年12月增长超6倍,编程场景增长超10倍。


创始人闫俊杰对2026年给出明确判断:编程领域将出现L4-L5级别智能;办公领域AI智能体渗透率将显著提升;多模态创作走向“直出可交付”。这三件事叠加,意味着Token量级很可能出现1到2个数量级的增长。


智谱则展现了定价权。3月16日,智谱推出全球首个面向OpenClaw场景深度优化的基座模型GLM-5-Turbo,同步上调API价格20%。这已是智谱近期第二次涨价——相对GLM-4.7,GLM-5已平均涨价50%;GLM-5-Turbo相对GLM-4.7平均上涨83%。2026年第一季度,智谱API价格同比增长接近翻倍,量价双增趋势明显。



04


电网公司:阿里巴巴的“Token帝国”


3月16日,阿里巴巴宣布成立Alibaba Token Hub事业群,由CEO吴泳铭直接负责。新组织以“创造Token、输送Token、应用Token”为核心目标。


这一组织架构的调整意味深长。Alibaba Token Hub包括通义实验室(负责“创造Token”)、MaaS业务线(负责“输送Token”)、千问事业部、悟空事业部及AI创新事业部(负责“应用Token”)。其中悟空事业部首度公开,定位为“B端AI原生工作平台”。


吴泳铭在内部信中表示,当下正处于AGI爆发前夜,大量数字化工作将由数以百亿计的AI Agent支撑,而这些AI Agent将由模型产生的Token支撑运行,成为人类与数字世界交互的主要载体。


阿里的深层意图已清晰:从“技术竞赛”转向“营收竞赛”,未来评价标准将直接是Token调用量。它既要做“电网公司”——通过MaaS平台输送Token,又要做“用电大户”——通过千问、悟空事业部消耗Token,在闭环内把Token价值吃干抹净。


阿里不是第一个意识到Token价值的玩家,但它是第一个将Token作为核心事业群独立出来的巨头。这一动作的潜台词是:Token不再是大模型的副产品,而是数字经济的原生货币。


05


用电大户:从SaaS到GaaS的范式跃迁


黄仁勋断言:每一家SaaS公司都将变成GaaS(智能体即服务)公司。以前卖工具,现在卖能干活的“数字员工”。企业不再为软件付费,而是为AI干活的结果付费。这是2万亿美元IT市场向数万亿美元GaaS市场跃迁的机会。


Menlo Ventures的最新调研为这一判断提供了数据支撑:2025年企业在生成式AI上的总支出达到370亿美元,较2024年的115亿美元增长约3.2倍,增长速度超过历史上任何一个软件品类。


更关键的是资金流向:超50%(190亿美元)流向了AI应用层,其余180亿美元流向基础设施层。这表明企业在AI投资上正优先关注能够尽快落地并提升生产力的解决方案。


AI交易的转化率也远超传统软件。一旦企业开始评估某项AI解决方案,47%的AI交易最终会进入生产环境,而传统SaaS的这一比例仅为25%。AI提供的即时价值足以让其“绕过”或缩短标准采购流程。



智能体越火,Token消耗越大,企业越面临成本失控的痛点。AI工作流系统、Token成本管控工具成为新蓝海。


PLG(产品驱动增长)模式正在加速AI产品渗透。数据显示,当前所有AI应用支出中,有27%来自PLG模式,这一比例约为传统软件的4倍。如果纳入“影子AI采用”,PLG驱动的工具可能已占AI应用总支出的近40%。


Cursor的案例极具代表性:在招聘第一名企业销售人员之前,营收就已达到2亿美元。它通过更快的产品迭代和更强的功能实现,在repo级上下文、多文件编辑等关键能力上比GitHub Copilot更早落地。


竞争格局也在重塑。在AI应用层,初创公司已占据63%的市场份额,而去年这一比例仅为36%。在产品与工程领域,初创公司市场占比达71%;在销售领域,这一数字高达78%;在财务与运营领域,初创公司占比更是达到91%。


这是一条完整而精密的财富食物链。英伟达垄断着生产Token的“生产线”,赚取最底层的“算力税”;云厂商和模型厂搭建着“电厂”与“电网”,在输送中完成价值分配;应用层和套利者掘金于最前沿,用速度和执行力捕获瞬时红利。


但在这场财富游戏的喧嚣背后,一个更本质的转变正在发生。


工业时代,我们用“千瓦时”计量能源;互联网时代,我们用“GB”计量流量。而今,Token正在成为智能时代的基础计量单位——它统一度量着数据、算力与智能服务的价值,让AI从技术创新真正迈入经济体系重构。


这不是一场技术竞赛,而是一场价值标尺的重塑。当Token像电力一样成为基础设施,当AI服务像用电一样按需取用,“计算自由”便不再遥不可及。


黄仁勋说,到2027年,这将是一个至少1万亿美元的市场。而在这场财富的重新分配中,每一个参与者都在用Token投票——投给效率,投给生产力,投给那个算力进去、价值出来的未来。


你是想成为规则的制定者,还是只是那个付账单的人?


答案,或许就藏在下一个Token里。

    频道: 金融财经
    本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
    如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
    正在改变与想要改变世界的人,都在 虎嗅APP
    赞赏
    关闭赞赏 开启赞赏

    支持一下   修改

    确定