本文来自微信公众号: 全天候科技 ,作者:全天候科技
2008年2月,巴菲特在致伯克希尔·哈撒韦股东的年度信中写下了一段后来被反复引用的话:
假如一位有远见的资本家当年能把莱特兄弟在基蒂霍克的试飞飞机打下来,显然是在为他的继任者造了大福。
这当然一句玩笑,巴菲特真正想说的是:
最糟糕的生意,是那种增长很快、需要大量资本来维持增长、最后却几乎赚不到钱的生意。
想想航空业吧,自莱特兄弟的年代起,持久的竞争优势就从未出现过。
这段话写在巴菲特人生中第一次投资航空股失败将近二十年之后。从1989年到2020年,巴菲特曾斥资百亿美元涉足北美航空股,但最终割肉巨亏离场。
民航业的出现,是人类交通方式的巨大革命,但作为一门生意,它的特征是:
巨大的资本开支、激烈的价格竞争、以及无论行业如何增长都难以回报股东的利润结构。
从莱特兄弟首飞到巴菲特写下那封信的整整一百多年,航空业消灭的资本比创造的利润还要多。
改变世界的技术和赚钱的生意之间,可能隔着一道永远无法逾越的鸿沟。
许多年以后,那架从基蒂霍克起飞的飞机,以另一种形式重新升空了。
一
免费午餐散场
2026年5月4日,五一假期的最后一天,豆包在苹果App Store页面挂出了付费版本的服务声明。三档订阅价格浮出水面:标准版每月68元、加强版每月200元、专业版每月500元。话题当天冲上微博热搜第一。
豆包官方称免费服务将始终保留,付费版面向专业生产力场景,方案仍在测试阶段。但用户最焦虑的不是收不收费,而是免费版是否会被降配?
过去十几年中国互联网的商业化剧本已经演过太多遍了:先免费获客,再降低免费体验,最后引导付费升级。
但这一次,促使豆包祭出付费版的因素,并不止于其在简中互联网遥遥领先市占率基础上的一次用户收割,而是成本端也开始扛不住了。
2026年3月QuestMobile数据显示,豆包月活用户达到3.45亿,稳居AI原生应用第一,比第二名千问和第三名DeepSeek的总和起来还多。一季度月人均使用次数54.8次,平均活跃率33.5%。
3.45亿月活,每人每月用55次,背后的成本注定是一个天文数字。
这种情况下,已经有不止少数用户反馈,豆包在晚间等高峰时段已出现用户发起次数过多导致的算力排队现象。
AI领域的持续投入与成本之下,字节跳动2025年净利润同比下滑超过70%,全年约1500亿资本开支中,约900亿砸向算力采购。
抖音副总裁李亮解释了这与优先股和期权变动股等会计因素有关,但AI投入确实对其利润带来了影响。
但后续的投入仍然是个天文数字,据FT报道字节2026年的资本支出预算约1600亿人民币,其中850亿用于AI芯片采购。
豆包免费或许很好用,但背后是字节的成本在负重前行,商业公司都有盈利的追求。就算抖音已成为流量印钞机,它也不可能无限期买芯片、投算力长期供数亿人免费使用。
互联网古早期的普遍免费逻辑,在AI时代正出现根本性变化,大厂们可能更早地进入收费期,来对冲日渐庞大且令人恐惧的电力和算力成本。
二
地表最强也不够赚
豆包的困境或许是"用户太多、成本太高",那么看看大洋彼岸那家被全球开发者公认为"地表最强"的Anthropic的毛利率,也仍然有着显著的天花板。
Claude在编程和Agent场景中拥有难以撼动的口碑,据Sacra估算的截至2026年3月数据,Anthropic年化收入已达到约300亿美元,较一年前增长约14倍。超过500家企业客户年消费超过100万美元,财富10强中有8家是Claude的客户。
收入增长堪称人类商业史上的奇迹,然而利润呢?
在走出了前期成本泥潭的2025年,Anthropic的毛利率改善后也仅有40%,但仍然低于此前50%的目标。公司预计到2028年毛利率才有望达到77%。
作为参考,传统SaaS软件公司的毛利率通常在75%到85%之间。Anthropic到2028年的目标,才刚刚摸到SaaS行业的底线。
这意味着,哪怕地表最强的大模型,在卖Token这件事上,也很难赚到SaaS级别的利润。
原因也很简单,每一次推理调用都需要实打实地消耗GPU算力和电力,这笔成本不会因为模型更聪明就自动消失。
Anthropic的CEO达里奥·阿莫迪曾对Fortune杂志说,如果AI进展延迟12个月,他就会破产,一家年收入300亿美元的公司说出这种话,足以说明Token生意的现金流压力始终悬于行业头顶。

三
成本的刚性
Token这门生意本身虽然代表了未来的方向,但在给股东带来回报方面,前景并不乐观。
从成本边际变化来说,生意大致可以分成三类:
第一类是边际成本趋零型。
它们是软件SaaS、游戏皮肤、数字音乐。
这些业态一次开发完成,每多一个用户的增量成本几乎为零,WPS多卖一份订阅,边际开支微乎其微。这类生意的毛利率往往在75%-85%甚至更高,是资本市场最钟爱的模型。
第二类是边际成本稳步递减型。
正如制造业所遵循的莱特定律:累计产量每翻一倍,单位成本下降约15%到20%。流水线、批量制造和现代化机床决定了制造业的规模越大时,成本越低。
第三类就是Token这门生意所处的位置——边际成本递减,但存在刚性底线。
必须承认,卖Token的成本并非完全恒定不变。随着规模扩大,推理芯片的利用率会提高,波峰波谷也可以通过混合调度打平,KV Cache等技术可以减少重复计算,模型蒸馏和量化也在持续降低单Token的算力消耗。
火山引擎总裁谭待在2024年就介绍过,火山通过PD分离和KV Cache等技术手段,实现了可持续的降本。DeepSeek V4在2026年4月发布时,更是通过全新的混合注意力机制,将百万上下文推理所需的计算量和显存分别降至V3.2的27%和10%。
但关键问题是:无论技术如何优化,Token生成永远需要实时计算。每一次推理请求都要GPU运算、消耗电力、占用芯片寿命。
不能把上一次推理的结果"复用"给下一个用户,每一个回答都是一次全新的计算。这使得Token的成本曲线有一个永远无法触及零的刚性底线,正如航空业无论怎么优化燃油效率,每飞一趟航班都需要烧掉实打实的航油一样。
更令人担忧的是,短期内这条成本曲线甚至出现了上翘。
DRAM存储器价格在2026年二季度预估跳升高达63%,NAND闪存价格飙升75%。摩根士丹利4月研报指出,存储之后,EUV光刻机和CPU将成为新的瓶颈。华为昇腾服务器3月底启动第二轮调价,910C单台上涨16万至48万元不等。阿里云4月18日起AI算力产品全线涨价,最高涨幅34%。
Token生意的边际成本虽能随技术优化和规模效应缓慢下行,却存在无法击穿的刚性底线,永远无法像传统SaaS那样趋近于零,这也注定了它的盈利天花板远低于标准化软件生意。
四
价格无限战争
再来说竞争格局。
2024年下半年到2025年初,中国大模型市场经历了一场惨烈的价格战。字节豆包报价低至0.0008元/千tokens,阿里通义千问主力模型降价97%,智谱将GLM-4-Plus降价90%。一元钱能买百万token,这在两年前不可想象。
到了Agent主导的2026年,风向突然转变了。
智谱率先打响涨价第一枪。从2月12日发布GLM-5到4月的GLM-5.1落地,三次相对上一代GLM-4.7累计涨幅达到83%。智谱CEO张鹏在中关村论坛年会上直言:调整价格是为了回归正常的商业价值,长期低价竞争不利于行业发展;瓶颈在算力,不在客户。
然而涨价的代价立竿见影。
GLM-5在2月中旬曾在OpenRouter平台位列全球第三,是中国调用量最高的模型。三次涨价后,到4月中旬已跌至第17位。
从时间线上看,智谱连续大幅涨价的区间,恰好与GLM系列在OpenRouter调用量排名明显下滑重合。虽不能简单将排名下跌完全归咎于涨价,但同步走势也侧面说明一件事:
AI Token行业用户价格敏感度极高、产品差异化壁垒不足、缺乏强势定价权,厂商很难脱离价格战独立提价而不丢失市场份额。
因为就在智谱涨价同时,几度延期的DeepSeek突然扔出炸弹。
2026年4月24日,DeepSeek发布了V4预览版并同步开源,V4-Pro总参数1.6万亿、激活参数49B,性能比肩顶级闭源模型;V4-Flash总参数2840亿、激活参数仅13B,输入定价低至0.14美元/百万tokens。
DeepSeek团队在技术报告中坦诚承认,V4-Pro"略落后于GPT-5.4和Gemini-3.1-Pro",但仍然以不到Claude Opus 4.6的1/8价格提供接近的性能,这对Token的"售价锚点"构成了持续的破坏。
Token生意的竞争顺序正在和航空业呈现出惊人的相似,即飞机谁都能买,航线谁都能飞,除非建立起垄断性的网络效应,否则竞争对手总能以更低的票价把乘客抢走。
在一个开源模型不断逼近闭源前沿的世界里,靠卖token建立持久的商业护城河,难度可想而知。
一年前比谁降得狠,一年后比谁涨得快。这种180度的急转弯本身就说明了一件事,这个行业的定价权极不稳定。
定价权不稳定的行业,很难成为好生意。

五
搬运工抵达战场
有关脆弱定价权的一个有趣旁证是,当大模型公司还在为Token成本焦头烂额时,一批聪明人已经找到了更轻巧的玩法。
那就是Token中转站。
猎豹移动董事长兼CEO傅盛推出了AI API聚合平台EasyRouter.io,通过统一接口帮用户调用GPT、Claude、Gemini、DeepSeek等40余个主流大模型;几乎同一时间,波场创始人孙宇晨也上线了类似产品b.ai。
最魔幻的一幕发生在5月5日。
特朗普家族的项目World Liberty Financial(WLFI)生态下的首个AI项目WorldClaw宣布上线,首发产品WorldRouter聚合了Claude、GPT、Gemini等300余个主流AI模型,声称调用成本比官方定价低30%,用WLFI旗下稳定币USD1结算,锁仓WLFI代币可兑换AI算力额度。
套餐则分四档,最贵的Max Plan售价9999美元,还宣称买Claude API额度,送海湖庄园私人晚宴抽奖资格,有机会与特朗普长子小唐纳德共进晚餐。
中转站之所以能让人蜂拥而入,在于它的商业模式极其简单:聚合多家大模型的API接口,统一封装后转售给终端用户,赚取价格差和服务费。它不需要训练模型、买GPU或建数据中心,它不生产Token,只做Token的搬运工。
但是,当一门生意的终端定价低到连"二道贩子"都能从中分到一杯羹时,说明生产者自己大概率是在贴着成本、甚至亏着本在卖。
更耐人寻味的是这门生意的竞争门槛。EasyRouter上线不到一周,就被开源社区开发者公开质疑其产品直接使用了NewAPI的开源代码却去除了版权信息。
这个插曲,本身说明了Token中转站的技术壁垒接近于零,一套开源网关代码、一台服务器、几个API Key,启动资金两千到五千元人民币,就能开张营业。
价格差、跨境壁垒、多模型适配的工程成本,这些缝隙叠加在一起,就给了中间商生存的空间,但当一个行业的中间商门槛低到这种程度,上游生产者的利润空间可想而知。
这门生意的出现,也恰恰映射了Token定价机制和竞争格局的深层矛盾。
因为与Token定价内耗并存的,还有另一个残酷真相:
大模型的行业竞争中,很难出现一家巨头可以在全部维度上长期确定的保持绝对领先地位。
Claude在编程和Agent场景中口碑最强,全球开发者社区几乎将其视为代码生成的基座生产力。
但在图像生成领域,OpenAI在4月21日发布的GPT Image 2一举登顶LM Arena所有图像排行榜第一,以242分的领先优势创下该榜单有史以来最大差距,而数个月前,该领域的王者还是谷歌的Nano banana 2。
往前倒推两个月,字节的Seedance 2.0于春节前横空出世,以多模态音视频联合生成能力惊艳全网;而在数学推理和科学领域,Gemini 3.1 Pro和DeepSeek V4又各有所长。
每个垂直能力维度上,领先者都在轮换。今天的王者可能三个月后就被追平,半年后就被超越。
这种"旋转门"式的竞争格局,对用户和投资者意味着同一件事,没有人能通过订阅单一模型来一劳永逸。
这也是为什么越来越多的深度AI用户选择同时订阅多个模型:编程用Claude,作图用ChatGPT,视频用即梦,日常对话用豆包或DeepSeek,各取所长、按需切换。
Token中转站的繁荣,正是这种多模型并行需求的产物:用户需要一个统一入口来调用不同厂商的API,而不是被锁定在任何一家。
对模型厂商来说,这意味着用户忠诚度极低、迁移成本几乎为零。Claude编程再强,用户也不会因此在视频生成上容忍你的劣势,他会直接切到Seedance。GPT作图再好,用户也不会因此放弃Claude的Agent能力。
每一家都在某个维度上阶段性领先,但没有一家能形成全面垄断,也就没有一家能建立起真正的定价权。
这和航空业又何其相似,每家航空公司都有自己的强势航线,但乘客从来不会因为一家公司京沪线飞得好就容忍京广线的高票价,届时他们会毫不犹豫地切换到另一家。

六
给显卡打工,比燃料吃力
如果把视野拉远一些,Token这门生意面临的还不只是成本、竞争格局和定价问题。
看整条价值链上的利润分配就知道了。
2026年,全球科技巨头以前所未有的速度把利润表上的数字搬到资产负债表上。字节全年资本开支约1600亿人民币。谷歌2026年资本开支预计1800亿至1900亿美元,Meta预计1250亿至1450亿美元。
然而这些钱最终都会流向英伟达与台积电。
英伟达2026财年营收2159亿美元,同比增长65%,GAAP毛利率高达71.1%。台积电一季度净利润同比增长58.3%。ASML将2026年全年销售预期上调至360亿至400亿欧元。
大模型公司烧钱买显卡、付电费、打Token价格战,英伟达和台积电赚走了超额利润。这和航空业一百年来的格局如出一辙,航空公司烧钱买飞机、付航油费、打票价战,最后波音和空客赚走了利润。
价值链上最肥的那一段,往往不属于直接面对用户的那一环。
更深层的问题在于"重资产悖论"。
即用户越多,需要的资本开支就越大;
资本开支越大,折旧和运营成本就越高;
激烈的竞争又限制了定价空间。
利润被两头挤压,模型越流行,资产负债表可能就越沉重。
市场喜欢将Token比作AI时代的燃料,这种叙事传播度虽然很广,但可能也低估了Token生意的困难程度。
燃料是资源品。石油、天然气、金属矿产,它们有一个共同的特征:
供给侧存在天然约束。
地壳里的原油储量是有限的,OPEC可以联手限产抬价,一口油井的开采成本构成了价格的硬底。
正因为供给有约束,资源品的生产商可以在需求旺盛时享有定价权,沙特阿美和必和必拓的利润率长期维持在令人羡慕的水平。
Token恐怕并不具备这种属性。
服务器、机房、电力、显卡,这些生产Token的物理母体在理论上是长期且无限的,只要愿意投钱买更多的GPU、建更多的数据中心、拉更多的电力专线,就可以无限放大Token的产出,很难有自然资源或自然规则约束这个过程,需要消耗的无非是资本和电力,这两样东西都是可以在市场上买到。
近年来,置身AI浪潮中的海内外科技大厂加大算力开支蜂拥而上,更像是短期以“不能把产能让给友商”为核心目标的一种担心掉队的恐惧所驱动。
但长期结构上,Token的供给侧永远无法形成类似OPEC那样的卡特尔状态。
在石油行业,即便需求暴涨,供给扩张也受限于勘探周期和地质条件。在Token行业,需求暴涨的信号一旦出现,全球的科技巨头会在几个季度内集体把资本开支翻倍,新的算力潮水般涌入市场。
短期内可能出现算力荒,比如2026年春季OpenClaw引爆的Agent热潮,但中期来看,只要利润率足够高,就会有更多资本涌入建设产能,然后再次把价格打下来。
这是一个典型的"高利润吸引资本、资本消灭利润"的循环。
石油和铜是自然地理环境所塑造的稀缺性,这显然是Token所不具备的。
也有人将Token比作传统电力,就像每一度电都需要烧煤或转动涡轮来即时生产,且电力本身极难储存和差异化。
但它实际的竞争格局恐怕还不如电力,因为后者起码有输配网络构成的区域性垄断,而Token连这一层保护都没有,正如算力服务器在廊坊,用户请求可以从东南亚发过来,中间没有物理壁垒。

七
升维叙事的隐秘代价
行业里不乏乐观者。
火山引擎总裁谭待在2025年末的FORCE原动力大会上提出了一个有趣的观点:目前基于Token的商业模式还很原始。
他认为,随着Agent的进步和普及,Token最终会走出"原材料"的定位,例如Agent可以将模型串联,云平台把Token组装成Agent,从更高抽象层次创造价值。"今天讨论Token,是在IT预算环节考虑;抽象成Agent后,可从BPO(业务外包)角度看待,那就是在扩大整个市场的规模了。"
谭待2026年4月进一步表示,AI行业以未来所有Token所能创造的收入规模作为终局来看,当前大概相当于一场42公里马拉松中"跑了一公里左右。
智谱CEO张鹏提出的则是Token Architecture Capability(TAC),即智能调用量乘以智能质量乘以经济转化效率。他在财报会上毫不讳言地将智谱定位为"中国的Anthropic",并认为高复杂度、高可靠性的高阶Token将拥有持续的定价权。
这些观点都有道理。但它们本质上在说同一件事:
卖原始的Token不赚钱,必须往上走,卖更高级的智能服务才可能赚钱。
问题是,这个升维叙事里藏着一个容易被忽略的隐秘代价。
无论服务抽象到多高的层次,Agent也好、BPO也好、数字员工也好,只要需要调用大模型来完成任务,底层就必然在消耗Token。
这个生意会向客户收取一个远高于Token成本的服务费,就像律所按小时收费而不是按打字数收费一样,可以赚取“智能溢价”。
但这里有两个问题。
一是模型侧的成本仍然是刚性的。
服务做得越多,底层消耗的Token就越多,成本随之线性增长。一个Agent执行一次复杂任务,Token消耗量可以达到普通对话的15倍以上。如果定价不能在覆盖成本基础上保留合理利润,生意很难长久维持。
二是溢价受制于竞争。
只要服务本身不具备独占性的数据壁垒或网络效应,竞争对手就可以用同样的底层模型、搭建类似的Agent工作流,以更低的价格抢走客户。从Token到Agent的升维,本质上是从一个红海游到另一个红海。
真正能在升维中赚到钱的,是那些在Token消耗之上叠加了不可替代价值的人。
他们或许拥有独占性的行业数据、或许有根深蒂固的客户关系、或许是竞争对手难以复制的工作流集成深度。但这种护城河不是Token本身赋予的,而是要在Token之外独立构建的。

八
高价值≠好生意
回到文章开头巴菲特在致股东信中开的那个地狱笑话。
航空业改变了人类的出行方式,但一百多年来,它成为一批有一批投资者的陷阱。
AI绝对会极大程度改变人类的工作和生活方式,但卖Token这门生意,未来的命题之一,或许是如何避免重蹈航空股的覆辙。
许多时候,高价值从来不等于好生意,更不等同于股东回报。
好生意需要满足几个条件:边际成本可控且能持续下降至低位,供给端存在约束或壁垒,竞争格局相对集中,拥有定价权,能够持续向股东返还超额回报。
这些条件,Token经济一个也不完全满足。
它的边际成本虽然在下降,但存在永远无法触零的刚性底线;供给端没有任何自然约束,资本可以无限堆叠算力来扩张产出;竞争格局极度红海,开源势力持续搅局;定价权在涨价和降价之间剧烈摇摆;利润大头流向了上游芯片供应商。即便升维到智能服务层,底层的Token成本仍然如影随形。
在那封2007年的致股东信里,巴菲特还留了另一句话并不太出名的话:
航空业的资本消耗自莱特兄弟首飞就是无底洞。
投资者总被增长吸引,虽然他们本应被增长吓退。
把这句话中的"航空业"替换成"大模型",把"莱特兄弟首飞"替换成"ChatGPT3.5出圈",恐怕依然有可能诶成立。
Token是高价值的,它正在重塑编程、医疗、教育、金融等一切知识密集型行业。
但很多高价值的东西未必是好生意,就像电力的出现塑造了整个人类工业文明,但全球电力公司的平均净利润率也不过是个位数。
未来真正能赚到钱的,或许不是卖Token本身,而是那些在Token之上建立起独占性壁垒的人,那些拥有不可替代的行业数据的人,那些把AI深度嵌入业务流程、使客户迁移成本高到无法离开的人,那些站在Token之上、而不是站在Token之中的人。
但在这些业态涌现之前,纯粹的生产Token很难成为一个好生意。
