AI行业告别烧钱造梦的狂热期,开始集体低头算账。行业核心转向验证效率与价值付费,商业模式分化为卖廉价算力基础资源与卖能替代人工的高价值数字员工两条路径,算不平商业账的技术将被淘汰。 ## 一、Agent从网页进入桌面工作流,调用成本激增 - AI应用不再局限于浏览器,而是以Agent形式被集成到微信、电脑桌面和企业业务流中,实现后台自动化工作。 - 这种转变导致模型API调用量呈指数级飙升,根据国家数据局数据,中国日均Token调用量在两年内飙升超千倍,于今年3月达到140万亿,按市价计算每日创造3亿多流水。 ## 二、商业模式两极分化:卖“廉价水电”与卖“高薪员工” 1. **中国AI军团的“规模游戏”**:以DeepSeek、智谱为代表的厂商凭借全球最低的推理成本,像卖水电一样提供极致便宜的Token,通过海量调用盈利。例如,智谱云端API业务年度经常性收入(ARR)已突破2.5亿美元。 2. **Anthropic的“价值游戏”**:Anthropic凭借主攻B端的编程Agent(如Claude Code),其年化收入达到300亿美元,反超OpenAI。其成功关键在于企业将其视为能替代高薪程序员的“数字员工”,对比的是人力资源预算而非软件订阅费。 ## 三、商业漏洞暴露:算不平账的业务被果断舍弃 1. **Anthropic封杀第三方工具**:为避免用户以固定月费薅取高额算力成本,Anthropic强制第三方工具用户转为按量计费,标志着“算力薅羊毛”时代终结。 2. **Sora因成本诅咒黯然离场**:尽管技术惊艳,但Sora每日运营亏损高达上百万美元,且因生成效果不可控无法形成商业闭环,最终被OpenAI关停,为盲目追求多模态技术的厂商敲响警钟。 ## 四、未来竞争核心:效率验证与智能密度 - 市场将只为两种极致价值买单:极致的算力性价比(如中国模型)和极致的业务结果(如Anthropic的编程Agent)。 - Google-MIT联合研究指出,若底层模型准确率不足(低于约45%),多智能体协同反而会降低性能并导致Token消耗激增515%。因此,提升“智能密度”(以更少Token完成更复杂任务)而非盲目打价格战,才是核心竞争壁垒。
Agent扎堆上线,但AI行业真正开始算账了
2026-04-21 11:36

Agent扎堆上线,但AI行业真正开始算账了

本文来自微信公众号:一财商学,作者:王艺霏,头图来自:AI生成


最近这一个月,关于AI行业最重要也最深刻的变化只有一个:它终于告别了“烧钱造梦”的狂热期,开始集体低头算账。


一边,是越来越多Agent突破了浏览器的禁锢,被塞进微信对话框、电脑桌面和企业真实的业务运转流中。模型API的调用量暴涨,AI大厂们终于摸到了按Token(词元)稳定收钱的商业命脉。


另一边,无论是普通消费者还是手握预算的企业CXO,都不再愿意为那些仅仅是“看起来很聪明”、“能写几首打油诗”的通用模型盲目买单。不是所有人都能承担得起200美元一天的“养虾费”,用户手里的这本账必须算清:用这个Agent,到底能不能帮我节约2个小时?能不能替我省下两个外包员工的工资?能不能实打实地提升这套业务流的转化率?


穿透热闹表象,本期AI月报将带你拆解AI行业的“冷账本”。



进入赚钱时代:AI从网页进入桌面工作流


如果说2026年的前两个月,AI大模型厂商第一次因为小龙虾(OpenClaw)能赚到钱了,那么到了3月,一场由小龙虾引发的桌面级Agent风暴,彻底改变了潮水的方向。


“小龙虾”的爆火,让普通人第一次直观地感受到:AI不仅局限在网页里,而是可以下载到本地、自己动鼠标,可以跨越不同的软件,在你睡觉的时候,不知疲倦地在后台帮你抓取竞对商品价格、清洗Excel数据。


这种奇袭,直接唤醒了头部AI大厂,发起一场“桌面入口之战”。


3月里,阿里、腾讯、智谱、阶跃星辰等大厂密集砸出了8款重磅Agent产品。这其中,尤其以腾讯和阿里的战略落子最为密集。


  • 腾讯的“入口降维打击”:3月9日,腾讯祭出Qclaw,它没有去搞什么花哨的独立APP,而是直接把Agent塞进了拥有13亿月活的微信生态里,可以通过微信语音给AI派活儿,AI在云端或本地电脑上自动执行。


腾讯用这种几乎零门槛的方式,最大程度模拟了OpenClaw的体验,将Agent的触达优先级提到了最高。


  • 阿里的“企业级系统接管”:相比腾讯在C端的猛攻,阿里的打法多线并进。3月3日,个人桌面Agent QoderWork全面开放,3月17日发布的“悟空”企业级Agent平台,既是独立应用,也嵌入钉钉,其本质不是一个聊天工具,而是原生调度钉钉底层能力、深度集成淘宝/1688/支付宝生态的“超级中枢”。


阿里试图让QoderWork和CoPaw接管个人办公和编程需求,让“悟空”和Accio Work接管企业的人事、财务、特别是电商营销等核心业务流,让AI成为能在企业组织架构中运转的“数字器官”。



Agent处理的任务更复杂了,费的脑子和体力也就更多了。


当AI从“聊天解闷”变成“挂在电脑后台自动干活”时,最直接的变化就是:使用频次呈指数级飙升,调用成本也开始暴露。


以前,你让AI写个小红书种草笔记,消耗的Token量有限。但现在,一个监控全网热点的自动化创意Agent,读取网页、抓取热点、创作,一次循环可能就消耗上万Token,一天下来就是海量的算力燃烧。


国家数据局3月23日披露的数据印证了这一疯狂的趋势:中国日均 Token 调用量在两年内飙升超千倍,在今年3月达到了140 万亿。按DeepSeek每百万Token 2块钱人民币的白菜价算,中国人光是烧Token每天也创造了3亿多的流水。


以至于Token在3月拥有了“词元”之名时,大家还在调侃它应该叫“偷啃”,就这么偷偷把钱包啃没了。但这对大厂来说,这代表AI正在以极快的速度进入商业化。


赚钱的两套逻辑:卖“廉价水电”与卖“高薪员工”


翻开各家的账本看一看,在当前的AI行业里,商业模式已经悄然发生了极致的分化,形成了两类截然不同的生意。


1. 中国AI军团的“规模游戏”:以极致性价比垄断自来水


既然让Agent干活需要消耗海量Token,最理性的选择是,哪个模型便宜就选哪个。在这场红利中,中国AI厂商凭借全球最低的推理成本和持续不断的工程优化,成了第一阶段最大的赢家。3月底OpenRouter的数据显示,全球模型调用量前6名都是中国AI。



这些中国厂商相当于“基础设施运营商”。比如DeepSeek、智谱,像卖水和电一样卖Token,他们不强求定制每一个具体的应用场景,而是致力于提供最便宜、最稳定、基础逻辑最过关的API接口。只要全网还有无数个类似于“小龙虾”的Agent在运转,他们的计费表就在跳动。


靠着这种务实模式,业绩立竿见影:截至3月,上市公司智谱的云端API业务年度经常性收入(ARR)已突破2.5亿美元。


但随着Agent的Token需求量加大,模型厂为了抢份额,免不了价格内卷。截至3月底,主流模型中最便宜的是阶跃星辰的Step 3.5 Flash,百万Tokens输出价格已经卷到0.3美元,最贵的Claude Opus 4.6是它的82倍。



2. Anthropic的“价值游戏”:能干活的“数字员工”反超OpenAI


如果说中国厂商在卖便宜的基础资源,那么海外巨头Anthropic(Claude大模型的母公司)则展示了一条暴利路线。


3月,Anthropic公开其年化收入(ARR)达到300亿美元,正式在商业营收上反超了OpenAI(约240亿美元)


很多人对此感到不可思议。毕竟OpenAI的ChatGPT拥有数亿的周活用户,而Anthropic的用户盘子只有ChatGPT的大概5%。它凭什么这么赚钱?


答案藏在他们的“企业优先(Enterprise-first)”战略中。Anthropic的营收大头,来自于其主攻B端办公开发需求的“编程Agent”(Claude Code和Claude Cowork)。仅仅是Claude Code这一项,2月份的收入就已经达到了25亿美元。


如果拿两家公司来比较:


  • OpenAI赚的是“软件订阅费”。C端用户花20美元买个辅助工具,这就注定了客单价的天花板。


  • Anthropic赚的是企业的“人力资源预算”。当企业采购Claude Code时,他们买的是一个岗位,比如一个能够深入真实代码库、自动审查、编写代码的高级研发工程师。


因此企业在买单时,对比的不再是其他软件的月租,而是硅谷动辄数万美元一个月的程序员薪水。如果一个AI能替代掉初级数据分析师或外包程序员的工作,企业花几百甚至上千美元,不仅不觉得贵,反而觉得捡了巨大的便宜。


Anthropic的成功证明了一件事:在AI领域,消费者规模和营收规模完全是两码事。直接插手企业最核心的工作流,切分最肥厚的人力预算,是Agent时代最强的现金牛。


此前Cursor、OpenAI、阿里、腾讯也都相继推出编程Agent,可以预见,编程模型/Agent将会是4月或第二季度AI商业化的竞争关键。


谁在为繁荣买单?AI商业漏洞的暴露与修补


行业越火爆,旧有商业模式里隐藏的漏洞就有可能暴露得越大。3月份的几个标志性大事件,都是AI厂商因为收支不平衡而做的割舍。


1. Anthropic 封杀第三方工具:终结“算力薅羊毛”时代


虽然Anthropic已经赚得盆满钵满,但他们在4月4日做出了一个极其强硬、甚至得罪开发者社区的决定:Claude的包月订阅套餐不再覆盖通过第三方工具(如OpenClaw)的API调用。所有想用第三方Agent的用户,必须老老实实转为按实际使用量付费(API Key模式)


这是因为过去几个月,大家只需要花费200美元开通一个高阶的Claude的包月账号,然后将账号授权给本地的OpenClaw,就可以不间断地调用Claude帮忙写代码。


在Anthropic看来这个局面就有点收不住了:用户花了200美元的月费,却跑出了相当于1000到5000美元的API真实算力成本。所以杜绝被薅羊毛,是AI商业化走向成熟的一步。


其实在API按量计费和订阅制付费之间,现在有很多大模型针对编程开发场景推出了第三种收费模式——Coding Plan(编程套餐)。这是一种针对开发者需求的“区间打包价”,费用和Token限制高出基础订阅制,但也没有API按量计费那么无上限,成本相对可控。


不过随着算力成本上涨,这种编程套餐也在纷纷涨价或者“限购”。比如阿里云百炼4月13日起最便宜的Lite套餐就要停售了,智谱的Coding Plan 2月时也涨价了30%。


看过Anthropic的“教训”,也许按量计费才是更合理的收费方式。



2. Sora 黯然离场:视频大模型的“成本诅咒”


3月24日,曾经创造了“AI界iPhone时刻”、惊艳了全球的视频生成模型Sora,被OpenAI正式宣告关停。


外界对此有诸多猜测,比如版权官司的重压、比如Grok Imagine等竞品的围剿。但真正压垮Sora的,依然是因为:算力太贵了,且无法商业闭环。


据估算,Sora每天的运营亏损高达上百万美元。如果在这种天价成本下,Sora能替广告公司或者好莱坞省下大笔制作费,那这笔钱烧得也算值。但Sora生成的视频在物理规律的一致性、精确控制上依然存在巨大缺陷,“抽卡”成功率还低于即梦、可灵等其他竞品,无法成为稳定可控的生产力工具。C端用户只愿意看个新鲜,不愿意为每天生成几个搞笑短片支付高昂的订阅费;B端企业又觉得它不够精确,无法投入商用。


在这种成本倒挂且缺乏清晰回报的死局面前,哪怕是财大气粗的OpenAI,也不得不选择断臂求生,将有限的算力资源集中到更能赚钱的GPT核心模型和编程场景上。


Sora的退场,给所有试图在多模态领域大力出奇迹的厂商泼了一盆冷水:如果算不平商业变现的账,再惊艳的技术Demo也只是过眼云烟。


但中国视频模型的节奏似乎没有受到影响。就在Sora关停第二天,快手宣布可灵AI的年化预计收入2.4亿美元。4月刚刚发布、多项评分超越Seedance2.0的视频生成模型Happy Horse,4月底就要开放API,它也将是视频生成领域的又一个有力竞争者。


算得平账,才能留在牌桌上


回顾龙虾余温中的3月,6款国产Agent密集上工、中国模型强势霸榜API调用量、Anthropic依靠B端编程业务完成营收反超,以及Sora因成本重压的黯然退场,都在指向一点:


AI行业已经彻底结束了“跑分炫技”的流量红利期,正式迈入了“效率验证”与“价值付费”阶段。


在这个新阶段,无论是开源还是闭源,无论是做底层大模型还是做Agent,市场的钱袋子已经做出了极其理性的分化,未来只为两种极致的价值买单:


  1. 极致的算力性价比:像中国大模型厂商一样,把推理成本压到极致,成为Agent时代不可或缺的“国家电网”,靠海量的并发调用赚取基础设施的利润。


  2. 极致的业务结果:像Anthropic一样,把AI封装成开箱即用的“数字打工人”,直接切入企业的核心业务流,用实实在在的降本增效成果,切分企业人力资源预算。


而当计费模式越来越精细,用户也开始变得极度现实。随之而来的,是行业对“劣质Agent”的抛弃。


Google-MIT的最新联合研究《Towards a Science of Scaling Agent Systems》表示,Token消耗量大,不等于AI更聪明。


研究表明,当底层基础模型的准确率低于某个特定阈值(约45%)时,盲目地引入多智能体协同(即让好几个Agent一起配合干活),不仅不会提高效率,反而会使整体性能下降39%到70%。更要命的是,它会导致Token消耗出现高达515%的冗余激增。


翻译成商业大白话就是:如果你用的底层大模型本身是个“半吊子”,逻辑推理能力不行,一旦你让它去执行复杂的多步骤任务,它就会在后台陷入“不断出错-疯狂试错-死循环”的泥潭,不仅没帮你把活干完,反而把钱烧得一干二净。


所以并非最能卷价格的模型最有优势,价格只是竞争的一部分。


就像智谱在财报里提出的商业价值公式一样:“AGI商业价值 = 智能上界 × Token 消耗规模”。这个公式的可取之处在于:它承认了 Token 规模的重要性,但把智能放在了第一位——效率才是放大器。AI需要提升“智能密度”,即用更少的 Token 完成更复杂的任务,以此作为核心竞争壁垒。


小米AI负责人罗福莉也表示:“我会建议所有LLM公司,在搞清楚‘coding plan怎么定价不亏钱’之前,不要盲目打价格战。”


在接下来的Agent集中PK中,只有那些能清晰证明自身 ROI(投资回报率)、切实替代人力外包成本的 Agent,才能拿到持续付费的商业机会。


本文来自微信公众号:一财商学,作者:王艺霏

AI原生产品日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定