出品 | 虎嗅科技组
作者 | 梁卡尔
编辑 | 苗正卿
头图 | 云天畅想
这是虎嗅WAIC“追踪Token商业新范式”系列文章第【07】期。
云天畅想这轮融资,不能只看成一家边缘智算公司的补血。
6月17日,云天畅想宣布完成超过10亿元人民币E轮融资,由中国互联网投资基金领投,中金资本等机构跟投。截至2026年6月,该公司累计融资超过30亿元人民币。伴随融资公布的,还有一个新战略宣布,公司定位从“边缘智算服务商”,拓展为面向AGI时代的“实时智算织网”。
可是,当普通大模型Token正在被大厂打成价格战,低时延、靠近终端的“实时Token”为什么还能卖出溢价?这是这轮融资背后的核心赌局。也就是说,云天畅想的客户是否会愿意为了“更快”持续多付钱。
过去两年,AI基础设施的主角是超大规模数据中心。科技巨头堆叠数万张GPU,训练更大的模型,争夺谁的模型更聪明的话语权。但当大模型开始进入应用阶段,行业矛盾正在变化。
更大的背景是,在这个转变过程中,Agent、Physical AI(物理AI)、智能座舱、AIPC、智能硬件等新场景,对响应速度、并发稳定性和服务覆盖能力提出了更高要求,也推动算力基础设施从中心化部署走向分布式网络化布局。
“过去大家只关心大模型的质量,但当AI走向规模化应用时,大家更关注成本、延时和交互的用户体验。”云天畅想首席科学家张霖涛告诉虎嗅。
但问题是,从训练转向推理是算力需求结构变了,这不意味着边缘的崛起。推理市场同样会被大厂压价,云天畅想要做的就是,找出一个不按照普通Token价格竞争的市场。
张霖涛用了一个商业比喻来解释这种变化,那些位于偏远地区、规模宏大的中央算力中心,本质上是AI时代的“炼油厂”,负责把原始数据“提炼”成高智商的模型;而云天畅想构建的分布式边缘智算网络,是密布在用户身边的“加油站”。当用户的“汽车”(智能终端)需要能量时,它不可能开到数千公里外的“炼油厂”,它需要在最近的“加油站”进行即时加注。
这个比喻能解释边缘算力的必要性,但解释不了商业性。加油站赚钱的逻辑是高频次、稳定的毛利和明确的单位经济模型,而不仅仅是便利性。放在AI推理里,就是低延迟能不能形成溢价,边缘节点能不能赚到钱,云天畅想能不能定义价格。
对云天畅想来说,其客户采购这类服务时,并不只看每百万Token价格,排序更靠前的是能否在不同地区落地服务,以及服务稳定性和质量。其客户通常有真实落地场景,对服务质量的要求高于单纯的价格敏感度。
云天畅想后续可能会考虑Token计价的产品,但至少在现阶段,价格并不是其客户采购时的第一权重。
低延迟不是护城河
实时Token是一个具有技术张力的核心赌注。
今天,卖云、卖算力、卖Token,本质上正在变成同一场生意,谁的成本更低,谁的供应更稳定,谁就能在价格战里多活一轮。
普通Token的价格正在快速下探。文本问答、摘要翻译这类推理需求,标准化程度高、对延迟不极端敏感,天然适合被大厂、公有云和模型公司卷成规模化商品。
云天畅想并不想进入这个最拥挤的战场。云天畅想联合创始人、首席战略官徐公美的判断是,要卖技术含金量高的实时Token。
所谓实时Token, 不是一个单纯的技术概念,也不是一个成熟的标准计价单位,而是一类商业场景,如实时语音交互、AI PC、智能座舱、游戏AI等现有的应用,以及未来的具身智能和物理AI。这些场景的共同点是,用户不能等,这也是云天畅想找到的差异市场。
云天畅想面对的并不是单一类型客户,使用中心云、公有云模型API、自建推理集群的客户都有,但更高频的共同诉求是低时延。原因有两层:一是时延直接影响用户体验,体验下降会带来用户流失;二是低时延会创造新的交互场景,比如智能耳机、智能陪伴等需要实时反馈的终端应用。
不过,对于哪些任务最容易打出ROI,云天畅想并未给出明确排序,只强调“低时延是核心场景”。究竟哪一类场景最容易打出ROI,仍需要更多客户案例验证。
一个聊天机器人慢两秒,用户可能还能接受,但游戏里的AI NPC反应慢半拍,沉浸感会被破坏,智能座舱和机器人更极端,很多交互和决策需要在毫秒级完成,不能把所有计算链路都拉到远端中心云。
张霖涛举了自动驾驶的例子,当车在路上行驶,留给障碍物识别并作出决策的时间通常只有数毫秒时间,这时候数据通过几千公里外的中央机房去计算。“算完了再传回来,车可能直接就撞上了。所以这种必须在最近的边缘端搞定。”
严格来说,自动驾驶是一个容易被误用,但能说明方向的例子。安全闭环必须在车端完成,不能依赖远端云,边缘节点更可能承担协同感知、地图更新、仿真训练、内容与交互等任务。这个边界说明,越靠近物理世界,计算链路越需要分层。
这种影响在物理AI与具身智能领域体现的将更为明显。当一个具身智能机器人在复杂的物理环境中行走、抓取物体,其背后每秒钟产生的Token调用量和图形渲染需求,远超传统聊天机器人,且对延迟敏感,不能完全依赖远端中心云。这种刚性需求让大型数据中心遇到难以解决的物理困境。
云天畅想的方案是,未来的算力基础设施不再是堆砌孤立的机房,而是一种分布式网络化布局。该公司正在通过构建覆盖全球300多个城市的边缘智算网络,将算力节点直接推到距离用户“最后一公里”的数字边缘,从而有机会完成实时Token的商业布局,但短期内难以成为商业模型的主要支撑。
图片来源:云天畅想
从被误解的“云游戏”到“GPU原生”
根据过往业务,云天畅想经常被贴上“云游戏”的标签。这既是它的起点,也一度限制了外界对它的估值想象。云游戏行业曾经热过,也冷过,市场对这个赛道的商业化耐心并不算高。但从另一面看,云游戏恰恰是最早验证边缘GPU能力的高压场景。
云游戏业务本质上是一套实时计算工程,对图形计算和算力压榨极为严苛、残酷,它要求在移动端实现超高画质的图形渲染,同时必须将端到端的流媒体传输延迟控制在毫秒级,否则玩家就会感到明显的卡顿。这类场景对GPU调度、低时延网络、异构硬件适配、峰谷负载管理等维度要求很高。
徐公美告诉虎嗅,云游戏公司是一种误解,云游戏是技术服务率先爆发的落地场景,但从底层架构和技术积累看,云天畅想并不认为自己只是一家游戏服务商。
张霖涛进一步解释,“云天畅想从成立第一天起,本质上就是一个GPU原生和边缘原生的分布式异构算力调度平台,所有的软件架构和网络传输,都是为了最大化释放GPU的能力而设计的”。国家企业信用信息公示系统显示,当前公司实体深圳云天畅想信息科技有限公司成立于2020年8月,实际业务探索始于2016年。
云游戏和AI推理表面上,一个算图形,一个算Token,但底层都需要GPU资源,都要求低延迟,都要处理高并发,都要在不同终端上保持稳定体验。“从算图形变成算AI(Token),对我们的底层架构来说,是一个自然而然、水到渠成的基因演进”,张霖涛告诉虎嗅。
这是云天畅想试图重估自己的逻辑,它已经进入AI推理市场。张霖涛说,“当头部客户提出高性价比、低延迟的AI推理需求时,云天畅想能够快速转化商业落地,在边缘端实现大规模的实时智算服务”。
但问题也在这里,云游戏能力能不能迁移到AI推理,不是靠一句“基因演进”就能证明的,更何况这背后还有商业的诉求。
真正的账,是怎么榨干GPU每一秒
当前AI基础设施赛道的投资泡沫已有所体现。一些独立算力服务商为了争夺大模型训练的订单,甚至盲目举债采购昂贵的芯片,导致毛利率为负,又或者单纯依赖持续烧钱来维持运转,其商业模型的健康度受到质疑。
云天畅想这门生意能不能跑通,维持毛利率,核心在于同一批GPU能不能在更多时间里赚钱。
云天畅想给出的解法是“算力复用”。按照其设想,边缘节点并不只服务单一场景。白天,服务器可以承接互联网平台的视频处理、大模型推理、智能座舱交互、企业AI任务;到了中午、傍晚或深夜等闲暇时段,算力又可以被调度到云游戏、实时渲染等场景。
如果这些负载能够错峰互补,GPU利用率就会被抬高,单个硬件的投资回报周期也会缩短。但这仍然是一个需要验证的商业假设。
更细的成本拆解目前云天畅想并未完全披露。这意味着,外界目前还很难判断其成本优势究竟来自哪里。对一家边缘智算公司来说,低时延是前台卖点,但后台真正决定利润率的,仍然是GPU利用率和单位算力成本。
云天畅想目前公开披露了覆盖全球300多个城市的边缘智算网络,也强调与运营商、内容平台、云服务商协同。但不同业务的负载是否真的能够错峰?边缘节点的平均利润率是否达标?这些如果不能持续兑现,“实时Token”就仍然只是一个好听的概念。
云天畅想另一个能力是国产芯片适配。
训练阶段,英伟达凭借CUDA生态、单卡性能和开发者体系,优势仍然明显。但推理阶段的逻辑有所不同。很多推理任务未必需要最顶级的单卡峰值算力,客户更关心性价比、功耗、稳定性和综合成本。
张霖涛认为,AI进入推理阶段后,国产芯片迎来了新的市场空间。“因为推理是面向具体业务场景的。一些大厂或者政府项目客户对底层的国产化率是有要求的。这时候,国产芯片如果能在某些特定场景下做好适配,把功耗降下来,性价比做上去,它就能很好地满足需求。”
他说,云天畅想要做的,就是帮国产芯片做好底层异构调度和调优。徐公美也透露,云天畅想在底层已与约90%的国产芯片厂商建立合作。多厂商、多架构芯片的异构调度与调优,确实可能成为云天畅想在特定市场中的竞争壁垒。
但国产芯片适配不是万能钥匙,英伟达的优势仍然明显,对云天畅想来说,国产芯片适配是苦活累活。换句话说,这个过程中的成本不容忽视。
在E轮的投资节点上,云天畅想提出“实时智算织网”的战略,押注在AI推理会在边缘端需求更多。但问题是,实时Token是否真有足够溢价,还要靠客户付费验证。很多客户最终可能会在端侧、本地私有云和中心云之间做成本权衡,而不是简单选择边缘节点。
不仅如此,物理AI仍是远期的商业蓝图,不是短期的现金流。机器人、自动驾驶和具身智能固然有更复杂的实时算力需求,但大规模商业化节奏并不明确。因此,融资背后是,在Token价格战之下,低延迟是否能拉起价格。
只有客户愿意持续付费买单,云天畅想才会抬高估值。
