当前AI已从拼模型、烧Token的早期阶段转向产业落地阶段,价值向云平台层沉淀,能交付业务结果的玩家才会最终胜出。 ## 1. AI竞争从模型比拼转向产业落地赛点 当前AI已经成为行业基建,竞争逻辑从早期的“淘金热”转为“卖铲子”,云厂商的比拼从「拼模型性能」转为「拼产业落地成果」,需要把技术匹配产业场景并跑出实际收入。这和当年互联网切换到移动互联网类似,底层基础设施值得重做一遍。 ## 2. Agent时代客户需求从资源转向结果 客户需求已经从买GPU等算力资源,转变为要AI在核心业务里稳定落地、产出实际效益,只认交付结果和确定性。 AI行业的衡量标尺已经从「烧了多少Token」转变为「带来了多少实际效果」,AI正在从“证明有用”切换到“靠ROI证明划算”,资本市场也开始按「产业基础设施」逻辑给AI定价,而非按软件应用估值。 ## 3. AI价值向云平台层沉淀,算力底座加速国产化 大模型行业正在复刻电力行业的利润分配逻辑:模型层利润被持续压薄,云平台层利润更稳定,且客户粘性更高。 当前国产AI芯片已从“备选”变为“主力”:百度昆仑芯P800已完成规模化验证,2025年至今交付多个万卡云;字节2026年AI芯片采购中国产占比超50%,推理端实现全栈国产替代;华为昇腾出货目标从30万片上调至75万片,中国AI重心已从“做个好模型”转向“搭建产业落地体系”。 ## 4. 头部云厂商基于自身基因走出差异化落地路线 - **阿里云押规模**:未来三年AI基础设施资本开支达3800亿以上,覆盖自研芯片、全球数据中心、大模型、机器人全栈,靠规模摊薄成本,已经靠AI需求重新拉动增速。 - **火山引擎押流量效应**:依托抖音、今日头条亿级C端试验场验证能力,豆包大模型日均Token消耗突破120万亿,先在C端跑通再打包输出给B端,当前已经将火力对准Agent落地。 - **华为云押纵深**:依托昇腾芯片、盘古大模型的软硬一体能力叠加「云、网、安」全套能力,主打合规要求严苛的政务、央国企、运营商市场,靠长期积累的行业理解和信任占据优势。 **核心结论**:越是容错率低、责任重的产业场景,客户粘性越高,谁先依托长期积累的能力站稳这类场景,谁就能卡住Agent时代的身位。
Token烧了那么多,最后的赢家或许“不看Token”
2026-06-25 18:35

Token烧了那么多,最后的赢家或许“不看Token”

本文来自微信公众号: 定焦One ,作者:定焦One团队,编辑:方展博


今年618,AI含量明显高了。


打开各大电商平台,AI购物助手在跟你对话,AI数字人主播24小时不停播,销售额堪比真人主播,大促素材全是由AI生成。甚至智能体工具渗透到了下单、付款环节,以往这个场景只有用户、商家、平台。现在一切正变得不同。


作为曾经移动互联网时代的一杆大旗,AI正在成为重要角色。以往618,比的是补贴力度和运营手段;这次开始秀谁的AI更聪明、落地更快。


这个现象只是冰山一角。就在同一周,字节被曝正洽谈采购5万颗以上国产推理GPU,给豆包大模型备货;阿里推出Qwen-Robot Suite,高调进军具身智能和机器人。国际上,OpenAI6月24日宣布联合博通推出自研芯片。AI大厂们不是在补全栈基建,就是让技术嵌进产业链,去接触真实的交易、真实的物理世界。


这些动作背后的原因显而易见,大家都看到,AI正作为一种基建,全面改造行业。如果把前些年的AI竞争比作“淘金热”,那今天已经切换到“卖铲子”。


最先看到这片新蓝海的,是各路云厂商。今年以来,云厂商较劲的维度,正从“谁的模型更好”,变成“谁更能让AI在真实业务里跑出结果”。大家都在展示各自的行业落地情况,从一个个细分场景倒推技术如何提升生产力。


当AI转向行业基建,云的战场已经换了规则,从拼模型,进到了拼落地的下半场,谁能将技术匹配产业场景、落地生根,形成依赖,进而跑出收入,变成结果,正成为新的赛点。


01.Agent时代,Token失效、“结果”更重要


云厂商的集体转向,要从客户端的需求变化说起。


过去十年,企业买云的逻辑很简单:要多少服务器、带宽、存储,你给我报价,我按用量付费。云厂商之间比的是性价比、稳定性、覆盖面。本质是“数字地产”生意,盖好机房,按量收租。


到了Agent时代,这套逻辑不适用了。


银行来谈云服务,关心的不再是“配多少张GPU”,而是“一千多个AI应用能不能7×24小时跑在核心业务里,出了问题谁兜底”。车企关心的是辅助驾驶模型能不能在平台上完成从训练到合规验证、再到量产上路的完整闭环。能源企业更直接:AI能不能进前端业务,在调度、运维、质检环节产出真金白银的效益。


客户想要的,已经从“资源”变成了“结果”。云厂商和客户的关系也随之改写:过去签完合同、机器搬进场,交付就算完成,剩下的靠客户自己的IT团队;现在客户只认“确定性”,交付能力、运维能力、行业know-how、响应速度,都是核心竞争力。


这种“从动作到结果”的转向,连最前沿的AI团队都在经历。在硅谷顶流播客Lenny’s Podcast最新一期里,Anthropic的Claude Code团队负责人Fiona Fung分享了她的观察:他们团队的代码交付量一年里涨到了原来的8倍。瓶颈不再是写代码,而是代码高速生产出来后,怎么验证质量、判断优先级、衡量真实产出。她特别强调:“Don’t mistake motion for progress(别把动作当成进展)”。追工具使用率,只是在衡量“动作”;能否真正改善目标结果,才是核心。


放到云这门生意上,处境是类似的。过去AI圈流行一种打法,叫“token maxing”:能烧多少token就烧多少,先跑出来再说,烧Token的量本身成了一种政绩。现在厂商和企业客户都开始追问回报。衡量的标尺,从“烧了多少Token”,变成“带来多少效果”。


图源/百度官方微博


峰瑞资本创始合伙人李丰在一期播客中也分享过类似判断:AI正在从“证明有用”切换到“证明划算”。前期投入靠FOMO(害怕错过)驱动,后期必须靠ROI说话。


这套逻辑放到中国云市场,一样成立。


过去两年,中国AI的故事基本围绕性价比和速度。模型成本低、应用上线快,这是中国AI的强项。DeepSeek去年初震动全球,靠的是用极低成本做出接近顶尖水平的模型。


但“省”不是终点,产业才是。“产业”指的是什么?有关注AI的投资人对「定焦One」表示,中国的大模型公司不缺模型性能,缺的是把模型能力接进产业的工作流;美国同行在掌控开发者入口和执行环境上走在了前头,中国得把这一环补上。


资本市场已经在用脚投票。6月16日,DeepSeek完成500亿元首轮融资,投后估值在3500亿-4000亿元之间,腾讯、宁德时代等产业资本入局。除国家AI基金外,投资方无投票权、设五年锁定期。这说明资本市场开始按“产业基础设施”的逻辑给AI定价,不再把它当软件应用。


那么,价值最后会沉淀在哪一层?有AI创业者做过类比:电力行业里,发电厂的净利润率只有5%到8%,电网公司却能拿到10%到15%。大模型行业正在走同样的路,模型层的利润被越压越薄,平台层的利润反而稳定。


云,就是这个“平台层”:不管底下跑的是ChatGPT还是DeepSeek,总得在云上跑。模型可以换,平台不好换。


而撑起这一层的算力底座,也在同步国产化。百度昆仑芯P800已完成规模化验证,2025年至今交付多个万卡云。字节2026年的资本开支预算上调到2000亿元,AI芯片采购中国产占比超过50%,推理端实现全栈国产替代;华为昇腾的出货目标从30万片上调至75万片。国产芯片正从“备选”变成“主力”,中国云上跑AI,正在减少对外部供应链的依赖。


资本按基础设施给AI定价,价值往平台层沉淀,算力底座转向国产,这几个维度指向的是同一件事:中国AI的重心,正从“做出一个好模型”,移到“搭起一套能落进产业的体系”。


政策也在往这个方向加码。2026年5月,三部委印发《智能体规范应用与创新发展实施意见》,把智能体定位为产业基础设施,目标2027年重点行业普及率70%。智能体已经从“创新项目”升格为批量的基建需求;这层基建往下落,最核心的载体就是云。


需求变了,供给端就得跟着转型,这和当年互联网切换到移动互联网是一个道理:底层基础设施都值得重做一遍。对云厂商来说,这是一道分水岭,还守着卖服务器、卖带宽的“数字地产”老生意,迟早被甩下;能把自己改造成帮客户跑出业务结果的“智能化服务商”,才接得住这波需求。


从这个角度看,最后赢的,或许是那些“最不看token消耗”的人。


02.头部云厂商们,各自拼什么?


进入2026年,四家头部云厂商都在讲“落地”,都在强调“怎么帮客户把AI用起来”。这一点没有分歧。真正的分野,在于用什么去落地、往哪个方向使劲。四家走出了不同的路,背后是各自的基因在驱动。


阿里云押的是规模。今年动作很猛:未来三年AI基础设施资本开支拉到3800亿以上;推出Qwen-Robot Suite(千问机器人套件);日本第五座数据中心落地;618期间把通义千问(Qwen)接进了淘宝。从芯(自研芯片平头哥)、云(全球数据中心)、模(千问)、体(机器人),全栈一路铺开,核心就一个字:大。


这套打法,和阿里做电商时的逻辑一脉相承:先把盘子做大,覆盖面够广,再靠规模效应和运营能力把成本摊薄。前两年阿里云增速一度掉到个位数,被外界质疑增长见顶;最近几个季度靠AI需求重新拉了起来,某种程度上是这套打法在新赛道上的再次验证。


火山引擎押的是流量效应。抖音、今日头条本身就是亿级用户的试验场,豆包大模型日均Token消耗突破120万亿,火山引擎的路线是,先在C端跑通能力,再打包卖给B端。这要求它迭代快、数据反馈快、技术验证快。


6月22日的火山引擎FORCE大会上,这条路线又往前走了一步:新发布的豆包Seed-2.1-pro补上了Coding和Agent能力,配套的“豆包办公模式”能接管发票汇总、选址调研这类办公场景。一个细节是,在现场演示和评测里,火山反复拿自己跟Claude、Opus对标。连字节这种最信奉“模型即产品”、最擅长C端飞轮的玩家,如今也把火力对准了Agent和落地。


华为云押的是纵深。昇腾芯片、盘古大模型、CloudMatrix超节点,软硬一体,再叠加“云、网、安”的整套能力,华为的主场是政务、央国企、运营商这些合规要求最苛刻的市场。这也是它从通信设备时代就攒下的研发底子和政企关系带来的。


这四种方式,其实是在回答另一个问题:Agent时代,拼的是广度还是深度?


字节、阿里押的是“广度”,但广度可以复制。阿里今天把Qwen接入淘宝,明天京东也可以接自研模型;字节今天用抖音验证Agent,明天另一个有C端流量的平台也能做。


在当下行业之中,有一类客户,是云厂商最难拿下、也最值得拿下的,那就是银行。


传统金融的服务选择标准,几乎是所有行业里最严苛的。因为金融几乎不容出错,一笔风控误判可能就是真金白银的损失,一次系统宕机牵连几百万用户。所以银行选云,看的不只是谁模型最新、参数最大,更看重厂商在这行跑了多少年、经历过几轮监管。这种信任只能靠服务时间一点点积累。


车企选云厂商的逻辑跟金融的底层是相通的。


辅助驾驶直接关系到人身安全。一旦出事故,责任链条怎么划、数据归属怎么定,这些不是一个算力供应商能解决的。车企要找的,是能跟它一起定标准、共建测试体系、共担安全责任的合作方。


和金融、汽车这种成熟行业不同,具身智能是一个标准还没确定的新赛道,所有玩家几乎站在同一起跑线上。


把这三个行业放在一起看,能发现一个共同的规律:越是容错率低、责任重的场景,客户越不会轻易换供应商。AI在这些行业里,已经不再是辅助工具,而是核心生产要素。谁先在这里站稳,谁就先卡住了身位。


能扎进这些场景,靠的不是一两年的冲刺,而是长期累积下来的几样东西:足够长的时间、足够完整的技术,以及对行业场景足够深的理解。

AI创投日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定