本文拆解了token降价但用户账单涨价的矛盾,剖析当前全球大模型行业两种差异化竞争路线,厘清AI定价的底层逻辑。 ## 1. 矛盾:token持续降价,账单反而越来越贵 - 行业数据印证token整体大幅降价:武汉大学团队统计发现,过去六年token价格整体下降约600倍,经济档模型价格半衰期仅1.10年,中档模型为1.55倍,降价速度快过摩尔定律,大模型行业整体处在罕见通缩中。 - 一线案例印证用户实际支出上涨:Django联合创始人Simon Willison30天消耗价值2180.16美元的token,仅支付200美元的补贴时代正在结束;OpenAI把GPT-5.5输入输出价格从2.5/10美元提至5/30美元,Anthropic维持Opus 4.7挂牌价不变,但通过新tokenizer让相同文本token量最多增加35%,有效成本达Opus 4.6的1.4倍,出现“明涨+暗涨”;Uber在2026年初就被Claude Code烧穿全年AI预算。 ## 2. 第一个核心原因:AI开始真正落地做复杂任务,消耗token量级暴涨 - 当前AI的使用场景从聊天、写作等轻任务,转向代码开发、复杂运维、金融分析等重Agent任务,单次任务背后实际消耗的token可达最终输出的几十倍甚至上百倍,需求总量大幅上涨。 - 这类涨价买的是顶级大模型的稀缺能力,只要能完成任务就不算浪费,类似买法拉利不会抱怨油耗,符合价值匹配逻辑。 ## 3. 第二个核心原因:大模型分层定价,不同等级token遵循完全不同的定价规则 - 经济档、中档模型符合降价规律,能力不断普及,价格快速向成本靠拢,正在迅速商品化。 - **旗舰顶级模型完全不遵循降价规律:武汉大学团队对旗舰模型价格做指数拟合,R²仅0.031,降价规律几乎完全失效,推理模型相对普通模型还有平均31.5倍溢价。顶级token正在快速“硬通货化”,价格不由成本决定,由稀缺性和不可替代性决定。** ## 4. 塔尖提价的本质:是对“最先进能力”位置的争夺 - 塔尖顶级模型的意义不止于卖高价,更在于定义行业方向:最新的架构、上下文、推理能力、训练方法都会先落地在塔尖模型,成熟后再通过蒸馏、压缩下沉到平价产品,塔尖的提价收益会持续投入下一代算力研发。 - 当前掌握全球最先进闭源模型优势的美国玩家,核心捍卫的不是具体模型版本,而是“最先进AI”这个位置,靠不可替代性获取溢价,再用溢价投入研发,赌自己的稀缺性长期不会崩塌。 ## 5. 两种产业路线的对赌:AI稀缺性的城墙能维持多久 - 中国AI不是单纯走低价路线,同样在争夺技术塔尖,只是更相信技术扩散的逻辑:参考新能源车、光伏、动力电池的产业路径,先追赶先进技术,再通过工程化、规模化把原本稀缺的顶级能力做成大众可及的标准化商品。 - 中国玩家赌塔尖能力扩散的速度,快于塔尖收租的速度,典型案例包括:DeepSeek把V4-Pro价格降到原价四分之一,价格仅为GPT-5.5的七分之一;智谱开源GLM-5.1,编程能力达到Claude Opus 4.6的94.6%,MIT协议允许商用且全程基于华为昇腾训练;火山引擎披露豆包大模型日均token突破120万亿,三个月实现翻倍。 - 当前全球AI行业正在对赌:美国赌“不可替代性”的城墙足够厚,中国赌这道墙会越来越薄,最终必有一方的下注成为沉没成本。
当Token 越来越便宜,账单为什么越来越贵
2026-06-13 18:11

当Token 越来越便宜,账单为什么越来越贵

本文来自微信公众号: 胡说成理 ,作者:胡喆,原文标题:《当 Token 越来越便宜,账单为什么越来越贵》


Django框架联合创始人Simon Willison,大概是今天世界上最懂Claude Code和Codex的开发者之一。


过去30天,他消耗了价值2180.16美元的token,实际支付只有200美元。


很多人看到的是划算。


Simon看到的却是另一件事。


因为这笔便宜,正在消失。


OpenAI已经把Codex从按消息估算改回按token计费;Anthropic没有提高Opus 4.7的挂牌价格,却通过新的tokenizer让同样文本最多多切35%token。过去被平台补贴掉的那部分成本,正在一点点回到用户账单上。


对Simon来说,这意味着一个非常具体的变化:过去200美元烧掉2000多美元token的日子,正在成为历史,而不会再成为一种长期模式。未来某一天,他消耗的那2180美元,很可能真的需要支付2180美元。


对任何重度开发者来说,这都不是一个轻松的消息。


问题在于,这件事几乎不可避免。


企业已经率先感受到了这种变化。


据The Information报道,Uber进入2026年没几个月就烧穿了全年AI预算,主因是Claude Code。4月23日,OpenAI发布GPT-5.5,输入和输出价格从GPT-5.4的2.5/15美元提高到5/30美元;Anthropic虽然维持Opus 4.7的挂牌价格不变,但Willison估算其有效成本约为Opus 4.6的1.4倍。


一个明涨,一个暗涨。


如果只看这些新闻,很容易得出一个结论:AI越来越贵了。


问题是,这个结论恰恰与过去几年最重要的研究结果相反。


a16z合伙人Guido Appenzeller给这条曲线起过一个名字:LLMflation。


2021年,每百万token 60美元的GPT-3级能力,今天只需要0.06美元。


武汉大学Mingdeng Du团队今年3月统计OpenRouter 318个模型和Epoch AI 3237条记录后发现,过去六年,token价格整体下降约600倍。经济档模型价格半衰期只有1.10年,中档模型1.55年,都快过摩尔定律。


如果只看成本,今天的大模型行业根本不像在涨价。


更像在经历一场历史上罕见的通缩。


于是问题来了。


如果成本在塌,账单为什么越来越贵?


因为企业今天付的钱,很多讨论把这两笔钱混在一起,于是永远算不明白这笔账。


先看第一笔。


Claude Code修一个Bug,不是在聊天框里回答问题。它要读代码仓库、分析依赖关系、调用工具、运行测试、理解报错,再把结果重新送回模型推理。用户最后看到的可能只是几百行代码改动,背后滚过去的却是几十万token。


推理模型也是如此。


行业测算显示,一些复杂推理任务里,模型内部消耗的token可以达到最终输出的几十倍甚至上百倍。


所以Uber的预算失控,未必意味着浪费。


也可能意味着另一件事:AI开始真正干活了。


过去几年,人们习惯把大模型当搜索引擎、聊天机器人或者写作助手。今天越来越多企业把它当工程师、分析师、运营人员和客服团队使用。


任务变复杂了。


消耗自然会上升。


买法拉利的人不会抱怨油耗。


不是因为他不在乎钱。


而是买法拉利,本身就是为了那套性能。


今天很多Agent任务也是一样。代码审查、复杂运维、金融分析、合同审核,这些场景里,顶级Agent和顶级模型往往是绑定关系。你当然可以换一个便宜五倍的模型,但结果很可能一起打折。


这部分钱,买的是能力。


它没有白花。


如果故事到这里结束,那么结论会很简单:AI更能干了,所以AI更贵了。


可问题偏偏出在这里。


过去几年最重要的研究结果,讲的恰恰是另一件事。


AI并没有变贵。


AI正在经历一场前所未有的降价。


很多人记住了武汉大学那篇论文里的六年降价600倍。


真正值得看的,却不是这组数字。


而是那条没有降下来的曲线。


论文把模型分层以后发现,经济档和中档模型都在沿着同一条轨迹下滑。能力越来越普及,价格越来越接近成本。


如果故事到这里结束,那么AI最终会变成一种标准化商品。


就像云服务器、电力或者带宽。


问题在于,偏偏有一部分模型不遵守这个规律。


论文对旗舰模型价格做指数拟合,得到的R²只有0.031。


翻译成人话就是:


降价规律到了这里,几乎失效了。


与此同时,推理模型相对于普通模型还存在平均31.5倍溢价。


这不是统计误差。


这是市场结构。


普通能力越来越便宜。


不可替代的能力没有。


OpenAI把GPT-5.5的价格提高一倍,Anthropic让Opus 4.7通过tokenizer提高有效价格,都发生在这条曲线之外。


于是一个有意思的现象出现了。


同样叫token。


有些token正在迅速商品化。


有些token正在迅速硬通货化。


前者的价格越来越接近成本。


后者的价格越来越接近稀缺性。


这也是为什么GPT-5.5和DeepSeek可以同时存在,而且都合理。


前者卖的是当前最强能力。


后者卖的是已经被验证、正在扩散的能力。


两者都在AI市场里。


但遵循的是两套不同的定价原则。


看到这里,一个问题自然会冒出来。


既然顶级模型最终都会扩散,既然今天的GPT-5.5迟早会变成明天的普通能力,为什么还要有人拼命往塔尖冲?


因为塔尖最大的价值,从来不是卖贵。


而是定义什么叫先进。


汽车行业就是这样。


一辆5万元的车和一辆500万元的车,都能把人从A点送到B点。后者当然更贵。但豪车存在的意义,从来不只是让富人消费。


ABS、ESP、主动安全、智能驾驶,很多后来成为行业标配的东西,最早都出现在最贵的那批车上。等技术成熟,再进入更大的市场。


豪车赚到的钱是一回事。


更重要的是,它定义了行业下一步往哪里走。


AI也是一样。


最新的架构、最长的上下文、最复杂的推理链、最激进的训练方法,都会首先出现在塔尖模型里。它们中的绝大多数会失败,少数成功的部分再被蒸馏、压缩、工程化,最后进入更便宜的产品。


塔尖不是为了卖得更贵而提价。


而是稀缺性和不可替代性,本身就是最刚性的价格支撑。


只要一个模型代表当前最先进能力,它的价格就不再完全由成本决定。


决定价格的,是有多少人需要它,以及有多少人能够替代它。


这也是美国前沿模型公司真正捍卫的东西。


不是某一个版本。


而是“最先进模型”这个位置本身。


美国以全球AI创新第一策源地自居。无论是否喜欢这个说法,至少在今天,它仍然掌握着最强闭源模型、最强商业化产品和最强融资能力。


既然掌握这个位置,价格自然不会跟着成本一起跌。


因为它卖的已经不是token。


而是不可替代性。


美国前沿收的那笔租,不是利润,是赌注的本金。


SpaceX的S-1招股文件里写着:Anthropic自2026年5月起向它采购COLOSSUS与COLOSSUS II的算力,合约到2029年5月,每月最高约12.5亿美元,而这只是它供应商名单里的一家。


从价格与成本那道缝里挤出来的钱,转手喂进机房。


这种承诺只在一个前提下成立:


它赌自己手里那点不可替代性,未来几年塌不下来。


中国押的也是同一道题。


只是方向不同。


很多人把中国模型理解成低价路线。


这是一种误读。


如果只是低价,中国不会出现DeepSeek的百亿美元融资,不会出现智谱持续冲击更强编码能力,也不会出现腾讯混元结束两年单边降价、重新提高API价格。


中国企业同样在争夺塔尖。


因为没有人愿意永远接受别人的价格锚点。


真正的区别在于,中国更相信技术扩散。


DeepSeek把V4-Pro永久降到原价四分之一,百万token输入输出合计约5.27美元,是GPT-5.5的七分之一、Claude Opus 4.7的六分之一,同时推进约100亿美元融资。小米MiMo-V2.5系列永久降价,最高降幅99%。火山引擎披露,豆包大模型日均token已突破120万亿,三个月翻倍。


这些动作背后不是简单的价格战。


而是一种产业判断。


过去二十年,中国最成功的产业几乎都遵循同一条路径。


新能源车如此。


动力电池如此。


光伏如此。


先追赶最先进技术,再把先进技术工程化、规模化、商品化,最后把原本属于少数人的能力带进大众市场。


AI正在重复这条路径。


塔尖当然重要。


但体积最大的市场,从来不在塔尖。


中国赌的是,塔尖能力扩散的速度,会快于塔尖收租的速度。


而这道墙现在有多厚,没人知道。


智谱4月7日开源的GLM-5.1,编程能力做到Claude Opus 4.6的94.6%,MIT协议商用零限制,训练全程跑华为昇腾、没有一张英伟达卡。


今天这场看上去在争token价格的争论,争的不是价格。


争的是AI的不可替代性还能维持多久。


美国赌的是这道墙足够厚。


中国赌的是这道墙会越来越薄。


等答案揭晓,两边的下注里,必有一笔成为再也收不回的沉没成本。

AI原生产品日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定