国产大模型公司正集体从卖算力转向卖Token和订阅模式，这一转变由C端市场疲软、融资环境收紧及海外成功案例驱动。然而，国内缺乏付费习惯、海外生态位固化及Token价格内卷三大障碍，使得复制海外模式困难重重，各公司正以不同策略应对这场生存挑战。 ## 1. 集体转身的三大推力 - **C端市场增长乏力**：MiniMax作为国内C端最佳案例，其2025年73%收入来自海外，毛利率仅25.4%；Kimi K2.5爆发式增长也主要依赖海外API收入，国内C端商业化基本停滞。 - **融资环境急剧恶化**：DeepSeek核心团队被高价挖角，标志着依赖自有资金烧钱的模式难以为继，2026年投资人更关注企业自身造血能力。 - **海外样本成功刺激**：Anthropic的Claude Code年化收入三个月从100亿冲到250亿美元，Cursor以500亿美元估值融资，验证了卖Token和订阅制两条路径的可行性。 ## 2. 海外土壤的三大基石 - **开发者付费习惯成熟**：美国开发者视付费工具为理所当然，Cursor定价20-200美元/月仅占开发者年薪1%以下，形成数百万付费用户基本盘。 - **企业采购流程标准化**：Salesforce开创的按席位订阅模式已运行二十年，企业IT预算、审批、续费流程高度自动化，使软件采购成为默认动作。 - **分层生态分工明确**：Anthropic等专注底层模型，Cursor等工具层封装产品，下游开发者付费，三方互不越界形成正向循环。 ## 3. 六家公司的战略押注 - **智谱押注付费习惯教育**：GLM Coding Plan半年涨价三次，最高档从80美元翻倍至160美元，调用量仍增400%，测试国内开发者付费意愿。 - **MiniMax尝试三条腿走路**：保留C端流量优势，挖角华为云高管强攻B端，同时加码AI编程赛道，多线并行等待突破口。 - **阿里以规模碾压对手**：成立ATH事业群由CEO亲管，将AI业务目标改为卖Token，通过上层应用带动底座消耗，发挥资源调度优势。 - **字节构建MaaS生态飞轮**：Seed模型层、Flow产品层、火山引擎商业化层分工协作，以49.2%的公有云调用量份额推动生态自循环。 - **DeepSeek死磕国产化替代**：优先适配华为昇腾和寒武纪芯片，牺牲推出速度换取供应链自主权，为长期竞争保留选择余地。 - **百度专注全栈TOB方案**：从芯片到应用全链路自研，面向政府、央企打包销售，与其他五家Token订阅模式形成差异化竞争。 ## 4. 难以逾越的三道坎 - **国内开发者拒绝付费**：二十年免费互联网培养的肌肉记忆难以改变，20美元月费相当于初级工程师半天饭钱，首选免费替代方案。 - **海外生态位已被锁定**：Cursor使用Kimi模型却独占500亿美元估值，国产模型仅作为廉价供应商，品牌溢价和订阅收入被海外生态截流。 - **Token价格陷入恶性竞争**：Claude Opus输出价25美元/百万Token，而国产模型仅1-3美元，价格差导致订阅制商业模式无法覆盖推理成本。 ## 5. 现实的商业天花板 - **模式可复制，土壤难移植**：国内公司能模仿Cursor产品形态，但缺乏付费习惯、企业流程和分层生态支撑，最终陷入同质化内卷。 - **Token经济毛利极薄**：上游价格战压缩利润空间，下游付费意愿不足，中间层难以形成可持续商业模式，规模做大但利润微薄。

2026-04-20 08:37

国产大模型集体转身

智远同学

速览

本文来自微信公众号：王智远，作者：王智远

过去六十天，国内大模型头部公司在集体做同一件事。

从卖算力、做项目，转向卖Token、做订阅。你可能会好奇，为啥动作这么一致？我拆了一下，觉得有三件事同时发生了，把大家推到了同一条路上。

第一件，C端这口井，挖不动了。这事MiniMax替所有人验证过；2025年它全年收入7903万美元，海外收入占73%，整体毛利率25.4%。这已经是国内C端AI产品跑得最好的一家了。

其他C端AI助手，到今天没一家把商业化真正跑通。

Kimi K2.5更说明问题，今年1月底发布，不到二十天，累计收入就超过了2025全年。数字看着猛，你拆开一看，核心增长全在海外。

Kimi自己在内部信里说，2025年11月以来，海外API收入增长4倍，海内外付费用户月环比增速超过170%，你看，国内C端这边，真的挣不动了。

第二件，钱不好找了。

这事最能说明问题的是DeepSeek。梁文锋过去三年一直说，幻方赚的钱够DeepSeek烧。这话到2026年，说不下去了。

过去一年，DeepSeek被精准挖走了五个核心成员，V2的关键开发者罗福莉去了小米，雷军开的是千万年薪。

R1核心研究员郭达雅去了字节Seed，传闻近亿总包，OCR核心魏浩然、多模态核心阮翀也先后走了，五个人，覆盖了基座模型、推理、OCR、多模态四条核心技术线。

别人都在融资、扩团队，给顶尖研究员开天价。它自己赚的钱烧自己」这套，扛不住了。

2023年那一轮，你能讲AI故事就能融资；2026年这一轮，你得证明自己能造血，这个信号，传给了所有还在牌桌上的人。

第三件，海外那两个样本，太扎眼了。

Anthropic的Claude Code，2025年5月正式公开发布，11月做到10亿美元年化，2026年2月冲到25亿美元。三个月翻一倍多。

这速度，当年Salesforce、Workday、ServiceNow那些后来千亿美金的SaaS公司，谁都没跑出来过。

更猛的是Cursor，TechCrunch 4月17号刚报，Cursor正在以500亿美元估值融资，比去年秋天的293亿几乎翻了倍。今年2月它年化收入20亿，公司内部预计到年底能干到60亿。

两个样本摆在那儿，信号很清楚；一个靠卖Token赚溢价，一个靠做订阅赚续费，两条路都跑通了。于是国内这几家公司集体转身，各自盯上了其中一条。

不过，在往下看之前，得先把这两条路拆开看一眼；一条是Anthropic走的，做底座、卖Token、赚溢价；一条是Cursor走的，做工具、做订阅、收续费，两条路的终点都是钱，但脚下的土壤完全不一样。

先从Cursor说起，因为它是国内几家讨论最多、对标最密集的那个样本。

Cursor到底是什么？

了解过的人都知道，这家公司走得挺曲折；AI编程刚火那阵，Cursor是顶流明星，一个IDE插件做到几十万日活；后来Claude、ChatGPT把编程功能嵌进自己产品里，还免费给用户用，Cursor的数据一下被打下来了。

那时，业内好多人都觉得它要凉了。巨头亲自下场，谁还会用一个套壳工具啊？

结果它不光没凉，反而涨回来了，还涨得比以前更猛；它靠什么？我觉得关键在它脚下那片土壤，海外这片地，有三样东西，是中国没有的。

第一样，愿意掏钱的开发者基本盘。

这事在国内看可能有点反直觉，在美国真的太常见了；从几十年前JetBrains那会儿开始，写代码的人每年自己掏几百美元买IDE，就跟设计师买Photoshop、会计师用Excel一样，天经地义。

工具是他们的吃饭家伙，花钱买好用的，没人觉得奇怪，这个习惯一直传到现在；你看GitHub Copilot每月10美元，JetBrains AI助手每月20美元，大家都觉得合理。

Cursor定价20到200美元一个月，放在这个环境里就很正常。一个全职开发者一年工资十几万美元，花一两千美元买工具，连1%都不到。

用着顺手就续费，不顺手就换，但绝不会为了省钱去用盗版，这就是Cursor的基本盘，几百万愿意每月为工具付费的开发者。

第二样，走通了二十年的企业采购流程。

海外企业早就把「按席位订阅软件」这套玩法走通了，这模式是Salesforce开创的，1999年上线以后，企业软件就从「一次性买断加每年服务费」，变成了「按人头按月付费」。

后来ServiceNow、Zoom、Slack、Notion、GitHub，一家接一家，全走这条路；走了二十年，企业的IT采购流程、财务审批、预算科目、续费机制，全按这套模式搭好了。

举个例子你就懂了：

公司招个新工程师，HR给他开账号的时候，顺手就把Cursor的席位加上，钱从IT预算里走，CFO根本不用专门审批。到年底续费，财务看一眼使用率和留存率，直接就续了。

这套流程最值钱的地方在哪呢？它把企业付费从「一件要专门决策的事」，变成了「一个默认动作」。

Cursor卖给企业时，相当于接了一条已经在正常流转的管道，省了太多麻烦。现在它60%的收入都来自企业客户，就是从这条管道流过来的。

第三样，分工明确的三层生态。

海外AI编程有一套完整的分层生态，各司其职，互不越界，上游是Anthropic、OpenAI这些底座模型公司，专门负责把模型训练好、把API做好。

中游是Cursor、Windsurf这些编程工具公司，负责把模型包装成开发者用着顺手的产品，下游是几千万开发者和几十万家企业，是最终掏钱的人。

这三层谁也不抢谁的饭碗，Anthropic赚Token结算的钱，Cursor赚订阅费，下游拿到好用的工具。三方都能获利。

这个生态能跑起来，核心是Anthropic这种底座公司主动选择了「只做底座」；它把API开放出来，让Cursor、Windsurf，甚至做文档、做测试、做客服的公司，都能接它的模型去赚自己的钱。

它不抢下游的生意，下游才敢放心把产品建在它的基础上。

最后就形成了一个正向循环，Anthropic越开放，下游生态越繁荣；下游生态越繁荣，调用它API的需求越大，Anthropic的Token生意就越好。

三样东西叠在一起，才长出了Cursor，所以你看，Cursor不止一个产品，是一套环境里长出的果实。

那国内这片地上，能长出同样的东西吗？六家公司怎么下注？

智谱赌「付费习惯能被教育出来」，这半年智谱路子很明确，砍掉了其他业务线，把全部资源压在GLM Coding Plan这一条腿上。

2025年底推出时，套餐月费最低才3美元，海外媒体还特意给它起了个外号，叫「3美元版Claude Code」。结果不到半年，连涨了三次价。

2月12号GLM-5发布，整体涨幅30%起。3月16号GLM-5 Turbo出来，又涨20%。4月8号GLM-5.1发布，再涨10%。最高档直接从80美元涨到160美元，几乎翻倍。

智谱CEO张鹏在财报电话会上说，一季度接口调用价格涨了83%，但调用量还是增长了400%。

敢这么连涨还能保住用户，意思很明显，智谱想用这组动作证明一件事：国内开发者，也愿意为好用的Coding工具持续买单。

MiniMax，它赌「三条腿走路」；过去的底子是C端，靠两亿用户堆出了一套流量打法。今年它做了个关键动作，挖来了华为云原中国区副总裁、现新加坡总经理胡维琦。

这个位置要的不是懂C端流量的人。

华为云那套打法你可能有所耳闻，派专门的服务团队住进客户现场，跟着客户的实际业务做深度定制，把每一个央国企客户都当成十年的生意来经营。

这步棋很关键，相当于MiniMax跟自己说，C端的底盘不能丢，但得再练一套B端的功夫，这个过程，最快也得一两年起步。

与此同时，AI编程这条线它也没让出去；智谱的GLM Coding Plan跑出订阅模式之后，MiniMax在模型和Agent上明显加大了压注力度，瞄的就是开发者这个赛道。

C端、B端、开发者，三条腿同时伸出去，哪条先跑通就压哪条。

阿里赌的最大，它赌「规模能碾压所有对手」。

3月16号，吴泳铭亲自下场，成立了ATH事业群，把通义实验室、MaaS业务线、千问事业部、悟空事业部、AI创新事业部全合到一起。

CEO亲自挂帅，核心动作很直接，把AI业务的目标从「卖算力」改成了「卖Token」。

但阿里这一轮真正值得琢磨的，不止底座这一边；阿里云同时在变阵，上层应用这条线也在加码，悟空、秒悟这些AI产品一个接一个推出来。

产品表面看是应用，往里拆其实都是一个个Agent，主要服务开发者和效率工作者这波人。

阿里算盘很清楚，上层应用用得越多，底座Token消耗就越大；底座Token卖得越便宜，上层应用就越能铺开；两头互相带动。

这个打法的逻辑特别朴素。我家底厚，人多，资源调度快，只要方向没错，就用规模碾压对手。

字节走得最早，它赌「MaaS生态能自己滚起来」。

Seed在2023年底就独立建制了，到现在跑了两年多，搭出了一套三层结构。Seed管模型，Flow管产品，火山引擎管商业化。

数据摆在这儿；IDC的数据，2025年上半年中国公有云大模型调用量，火山引擎占了49.2%，超过第二、第三位的阿里云和百度智能云加起来还多。

字节押生态逻辑；我模型够便宜，平台够好用，调用量就会自己涨；调用量涨了，上下游玩家就会围过来；玩家多了，生态就能自己养活自己。这个飞轮一旦转起来，会特别快。

DeepSeek有点不一样，它看着最没动作，动作可能最重。

目前能拿到的消息，它在死磕国产芯片适配；V4版本优先给华为昇腾和寒武纪做预发布，要从英伟达CUDA生态，硬生生切到华为CANN框架。

这条路代价太大，节奏会明显变慢；V4从2月一直推到4月，还在隐身测试，市场对它的预期一直在往下调。它看起来像那个「掉队」的人。

但换个角度想，这条路也保住了一样别人都在放弃的东西，当其他家都绑死在英伟达和Token订阅的路子上时，DeepSeek还有别的选择，它赌跑得快的未必能赢，留得住选择权的人，才能笑到最后。

还有一家，走了一条完全不同的路。

百度2025年AI业务收入400亿，其中AI云基础设施198亿，同比增长34%。但百度似乎根本不在意Token订阅这门生意。

它走全栈路线。底层自己做芯片(昆仑芯)，中间做模型、训练平台，往上做智能体、应用，从下到上一整条链，全是自己攒的。

客户主要是金融机构、央国企、政府、大型制造业，一套打包方案卖给你，这玩法，跟其他五家完全是两个物种。

六家大厂，看着同一件事，动作天差地别；智谱、MiniMax、阿里、字节、DeepSeek，五种不同的赌法，百度干脆说「我躺平做TOB生意就够了」。

那问题来了，这么多种押法，到底哪种能押中？或者换个问法。卖Token、做订阅这条路，到底学不学得会？

答案很明确。短期内，学不来。国内这片地上，长不出一模一样的东西，听着有点绝对，你跟着我拆一下就明白了。

第一道坎，国内开发者不愿意掏钱。

过去二十年，中国互联网的默认玩法是「免费」。从早年下载盗版软件，到后来找开源替代品，再到现在用破解版、白嫖免费版，写代码的人早就习惯了「工具不花钱」这回事。

你让他每月掏20美元买工具，他第一反应，为啥要花这个钱？有没有免费的？

这种本能，二十年攒下来的肌肉记忆，改变需要时间。

Cursor定价逻辑，放在美国没毛病；搬到中国，一个标准档位的费用差不多能吃掉初级工程师小半天的饭钱。与其花这个钱，他宁可花半小时去GitHub上找个免费替代品。

这是第一头拦路虎。更扎心是第二道坎，海外位置早就被占死了。

肯定有人会想，国内做不通，做出好模型卖到海外不就行了？海外开发者有钱、愿意付费，去赚他们的钱不好吗？

不行。位置轮不到你。

3月底，Cursor发了新一代编程模型Composer 2，宣传语吹得挺唬人，叫「前沿级编程智能」；博客里压根没提它的底座是谁。

三天后就被开发者扒出来了，Composer 2底座是Kimi K2.5，藏都没藏干净；月之暗面预训练负责人杜宇伦在X上确认了，双方通过Fireworks AI平台有授权合作。

这事本身没啥瓜可吃，开源模型被二次训练、重新包装，行业里本来就是常态。

值得你多琢磨背后的账本，据《财富》的报道，Cursor在ARR 5亿美元时，每年付给Anthropic的推理费大约6.5亿美元。

每一块钱订阅费，背后的成本超过一块钱，一直在赔本赚吆喝；直到把Kimi这种便宜的中国模型接进来，压下推理成本，才在企业客户那端实现了微薄的正毛利。

你品品这个账，品牌挂Cursor，订阅费全归Cursor，500亿美元估值也归Cursor。那Kimi在里面扮演啥角色？就是个按Token结算的底座供应方，而且是「更便宜的那一个」。

一个估值500亿美元的编程工具，靠压低上游中国供应商的价格，才救活了自己的毛利；这就是海外下游生态对国产模型的定价方式。海外的赢家吃肉，中国的供货商喝汤。

第三道坎，Token已经卖不出价钱了。说到这，肯定有人要反驳。OpenRouter上国产模型不是霸榜了吗？前五里占四席，这还不算赢？

算赢，但只赢在调用量，没赢在收入。

OpenRouter是聚合平台，开发者拿一个API Key，就能在所有模型之间自由切换，哪个便宜用哪个；调用量大，只能说明海外开发者在频繁试用你；跟背后有没有稳定的付费用户，完全是两码事。

Cursor拿国产模型当底座能赚大钱，因为它有几千万订阅用户。国产模型在OpenRouter上调用量再大，最终把订阅费变成真金白银的那一步，还是被海外生态收走了。我们看似参与了，只赚了点零头。

那品牌就品牌呗，做底座生意也挺好，卖Token照样赚钱。

这恰恰是最要命的地方。

Claude Code能跑通订阅制，前提很简单；Anthropic的Token能卖溢价；Claude Opus的输出价25美元每百万Token，靠这个单价，它能覆盖推理成本、训练成本，还能剩下毛利。订阅制的账才算得通。

再看国内。从2025年下半年开始，Token价格就被字节和阿里卷到地板价了。字节豆包进入「厘计价」时代，阿里千问主力模型降价97%。

具体到编程模型，差距更吓人。MiniMax M2.5输出价1.2美元每百万Token，智谱GLM-5也就3.2美元。同样一百万Token，Claude能卖15到25美元，国产模型只能卖1到3美元。

你想想这差距意味着什么。

Claude Code的订阅制商业模型，直接搬到中国来复刻，地基就少了五分之四。

订阅制的账很朴素，用户每月给你付X块钱，你拿这笔钱覆盖推理成本，剩下的就是毛利。

Anthropic能做到，因为它Token单价够高，订阅费减掉推理成本还有剩余；国内Token单价只有它的1/5到1/12，同样一份订阅费，光推理成本就快不够覆盖了。

上游已经卷成红海，下游付费端还没长起来，中间这段，根本挤不出利润空间。

三道坎挡在前面，产品能学得来，土壤学不来。最后能学成啥样？

大概率是这样一幅画面：六家都把Cursor、Claude Code的中间层各做一遍，国内市场里互相卷；底座那头，Token价格被卷到地板，规模做大，毛利做薄，每一分钱都得从石头里榨出来。

这就是Token经济真实的天花板。

AI原生产品日报频道: 前沿科技

智远同学

公众号同名《复利思维》作者

bx19891217

认证作者

已在虎嗅发表 387 篇文章

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP