本文来自微信公众号: AI超维度 ,作者:北京汉·索罗,原文标题:《光模块独家解读|CPO延期,谁被市场误伤了?》
6月9日,一份只发给机构客户的报告,让全球光通信板块坐了一次过山车。
报告来自美国半导体研究机构SemiAnalysis,核心判断是:CPO(共封装光学)的大规模商业化时间表要推迟到2028至2029年。
CPO是AI数据中心里芯片之间通信的下一代技术方案,过去两年,整个光通信行业都在押注它能大幅降低芯片间数据传输的功耗。
这份报告的原文普通人是看不到的。但核心结论很快通过财经媒体和社交网络传播开来,被市场翻译成了一句更简单粗暴的话:CPO要推迟了。
全球光通信板块应声大跌。美股光通信龙头Coherent当天跌超11%,Lumentum跌超8%,A股和台股的光通信公司也在次日集体下挫。
问题是,Coherent和Lumentum做的是可插拔光模块,也就是当前光通信行业的主流产品,而CPO是下一代方案,如果CPO大规模普及,会替代一部分可插拔光模块的市场。
按理说,CPO大规模商业化推迟,对这些公司应该是好消息:替代者来得越晚,现有产品的生意就能多做几年。
但市场好像没有做这个区分。
这背后是一个过于简单的二元框架:CPO好则光通信好;CPO差则全板块差。在这个框架里,CPO就等于整个行业未来。
可是事实上,AI数据中心里的光连接,并不是一道二选一的题。除了当前主流的可插拔光模块和更激进的CPO,中间还有第三条路线:NPO(近封装光学),目前被大多数投资者忽略了。
它可能比市场想象得重要。
光模块是芯片之间的“翻译器”
要了解第三条路线是什么,需要先理解光模块在AI产业链中扮演的角色。
训练一个大模型,需要几万颗芯片同时工作。每完成一步计算,芯片就要把中间结果传给其他芯片,再一起进入下一步。芯片之间的数据传输速度,直接决定了整个系统的效率。
短距离数据传输可以走铜线,原理和家里的网线差不多。但距离一长,铜线里的电信号会衰减变形,传不过去。这时就要靠光纤解决问题,光信号在玻璃纤维里传输,速度快,距离远,信号几乎不衰减。
问题是芯片处理的是电信号,光纤里走的是光信号,这就需要有个东西在两者之间做转换。光模块就是这个“翻译器”:发送端,光模块把电信号转换成光信号;接收端,另一个光模块再把光变回电,交给对面的芯片。每一条光纤连接的两头,各需要一个光模块。
一个大型AI集群可能需要几十万个光模块。谷歌2026年预计出货近400万颗TPU(它自研的AI芯片),仅这一个客户就对应超过600万个高速光模块需求。按模块单价1000到1500美元算,这是一个体量很大的生意。

2026年,谷歌、亚马逊、微软和Meta四家的资本开支合计预计达到7250亿美元,同比增长77%。虽然这笔钱不等于光模块的市场规模,它会分流到芯片、服务器、电力和散热等方向。但传导链条是清晰的:资本开支扩张带动集群扩张,集群扩张推高网络带宽需求,最终传导到光模块的采购量上。
所以,AI集群越大,光模块用量越多。它本质上是AI数据中心的一笔"连接税"。
而且,前面我们提到,芯片之间短距离连接走铜缆、长距离走光纤。过去这个分工很明确。但现在,铜缆能覆盖的"短距离"正在急剧缩短。
原因是速率。铜缆在低速率下可以传很远,但速率越高,信号衰减越快,有效传输距离越短。当前一代AI集群的连接速率正在往每通道200Gbps走。在这个速率下,普通铜缆的有效传输距离只剩2到3米,加了信号增强的有源铜缆也只有3到5米。
英伟达当前一代的GB300 NVL72机架宽0.6米。下一代Rubin Ultra NVL576需要八个机架并排,总宽接近5米,已超出有源铜缆的物理覆盖范围。大量粗铜缆堆在一起还会堵死机架内部的气流通道,带来散热问题。
在每通道200Gbps的速率下,铜缆在物理上已经做不到了。
这意味着原来不需要光模块的短距离连接,现在也得用光模块了。光模块的需求不只是随集群变大而增加,还因为铜缆退场而加速增加。
SemiAnalysis的报告之所以能引发全球板块波动,就是因为光模块正在变成AI数据中心的一笔大账,而下一代技术方案的推迟,它直接影响市场判断接下来真金白银应该放到哪条路线上去。
CPO做的是什么
光模块变成刚需,用量飞速增长,随之而来的问题就是:能不能让光模块更省电?
CPO就是冲着这个问题去的。
当前主流的可插拔光模块是这样工作的:它装在机箱前面板的标准化插槽里,离计算芯片有15到30厘米的距离。芯片发出的电信号要走完这段铜走线才能到达光模块。问题在于,高速电信号在走这十几厘米铜线的过程中会严重衰减,所以光模块内部需要一个叫DSP(数字信号处理器)的芯片来恢复信号质量。
DSP很耗电。一个800G光模块里,DSP吃掉了大约一半的功耗。一个20万GPU的AI集群,仅光模块就要消耗17兆瓦的电力。
CPO的思路很直接:既然电信号走铜线会衰减,那就别让它走远。把光引擎从机箱前面板搬到计算芯片旁边,距离从十几厘米缩短到几毫米。电信号路径短了,不需要DSP了,功耗大幅下降。
一个800G可插拔光模块功耗约16-17瓦,英伟达CPO交换机中同等带宽的光引擎加外置激光源功耗约4-5瓦。模块级功耗下降约73%——所有人看好CPO都是从这个数字开始。
但事实上,放到集群层面看,数字并没有73%这么诱人。
因为CPO最终还是要部署到一个完整的AI集群里,得从单个模块拉到系统层面算总拥有成本。SemiAnalysis 1月的CPO长文算了下这笔账,发现CPO路线下,交换机成本反而上升了81%——因为要往里面塞光引擎、外置激光源和更复杂的封装。CPO取代可插拔光模块后总网络成本确实降了31%,但拉到整个集群层面后,把GPU服务器、网络、散热全算上,总成本只降了3%到7%。
而且集群层面的总功耗节省大约只有2%。因为GPU服务器才是成本和功耗的绝对主体,网络层的改善被整体结构稀释了。
不仅如此,CPO有个致命的“枷锁”。
在CPO方案下,光引擎和计算芯片是封装在同一块基板上,如果一颗光引擎坏了,整块板都要一起返厂,包括那颗价值数万美元的芯片。
换言之,CPO如果坏了,整个交换机都要下线。
而当前的可插拔光模块坏了,运维人员把它从前面板拔出来,换一个新的就行,几分钟的事。
还有良率问题。一台CPO交换机需要把几十颗光引擎焊接到同一基板上。如果单颗贴装良率是95%,32颗的系统良率就只剩19%——每五台只有一台完好。SemiAnalysis 6月报告还披露了一个新问题:英伟达第二代光引擎出现了插入损耗过高的情况,性能甚至不如上一代。
良率之外的阻力
上一节说的是供给侧的问题:CPO能不能做得出来、做得便宜,坏了能不能修。
6月9日报告刷屏之后,所有讨论都集中在良率不够、插入损耗高、可维护性差这些工程问题上。
但就算这些工程问题都被解决,CPO还有一个需求侧问题:客户愿不愿意选你。
当前可插拔光模块的市场是开放的。模块插在设备前面板,接口和外形规格标准化,几十家供应商在竞争。云厂商客户今天可以向中际旭创、新易盛采购,明天也可以换Coherent、Lumentum或别家。谁价格好、交付稳、性能好,单子就给谁。客户的议价能力很强。
CPO会改变这个买卖方格局。
因为CPO不是把一个标准模块插进设备里,而是把光引擎更深地嵌进交换机和封装系统。光引擎要和交换芯片、基板、外置激光源、散热和封装工艺一起设计、验证。到了这个层级,客户就不能在“几十家模块厂”里精挑细选了,而是得绑定某一个系统平台和它背后的少数合格供应商。
目前CPO方案主要围绕英伟达和台积电的COUPE封装平台展开,供应商选择空间要比可插拔光模块窄多了。换句话说,可插拔方案下是“我买谁家的模块都能插”;CPO时代更接近“我先选了谁的平台,再在这个平台允许的供应链里选”。这就是云厂商担心的锁定。
光模块年采购额高达数百亿美元,云厂商不会轻易把这么大一笔的采购选择权,交给一个更封闭的平台。
所以Meta和微软都在公开倡导开放、竞争性的可插拔CPO生态,核心诉求就是避免被单一供应商锁定。Ciena(美国光网络设备巨头)今年2月发布可插拔CPO光引擎Vesta 200,主打的不是性能参数,而是“开放、多供应商、可互操作”。它的研发负责人在新闻稿中说,客户要的就是这个。LightCounting(光通信行业研究机构)CEO也指出,CPO要真正起量,得等五大云厂商里有一家给出明确信号。
良率是工程问题,砸资源终究能解决。但云厂商客户们对议价权的执念不是工程问题。CPO越深入系统内部,云厂商越会追问一句:省下来的电,值不值得我交出供应链选择权?
被忽略的第三条路线
如果CPO面临的不只是工程瓶颈,还有来自最大客户群体的结构性抵触,那有没有一种方案能同时绕开这两层障碍?
有。它就是NPO(近封装光学)。

NPO的做法很好理解。CPO是把光引擎焊在计算芯片旁边,坏了一起返厂;NPO是把光引擎推近芯片,但又保留了可拆卸性,坏了可以单独换。
它可能比拼不了CPO的极致低功耗,但它既缩短了电信号路径、砍掉了DSP功耗,同时还保留了当前可插拔光模块的核心优势:模块坏了可以换。
从云厂商客户的角度看,选择NPO意味着可以保留供应商选择权,不用把年支出数百亿美元的采购品类锁定在一个封闭平台上。
从光模块厂商的角度看,NPO让它们留在了价值链的有利位置。有产业人士测算过,NPO架构下光模块厂商的单元价值捕获可能显著高于CPO,甚至达到约两倍。因为NPO路线下,光引擎是独立模块,厂商参与设计、组装和交付全流程,而CPO路线,厂商退化为元器件供应商。这个倍数未必能直接外推到所有场景,但方向很清楚。
从系统厂商的角度看,NPO降低了一步到位的风险。不用把几万美元的芯片和光引擎绑在同一片基板上赌系统良率。
在过去多数讨论中,NPO时常被当作CPO到来之前的权宜之计。但如果CPO一边有未解决的工程问题,一边还会受到客户群体的结构性阻力,那作为一个能让供需两侧都有动力维持的方案,NPO的窗口期也许就不只是“几年缓冲”了,很可能是一条持续更长时间的主赛道。
市场不会等
英伟达高管说“CPO下半年放量”,AI云服务商Lambda最近也开箱了CPO交换机实物,但“客户开始测试”和“云厂商把CPO写进几十亿美元采购计划”不是一回事。

让光引擎越来越靠近芯片,这一技术方向肯定没有争议。但有争议的是,从今天走到CPO全面放量,中间那段路有多长。
CPO越晚跨过商业放量的门槛,NPO就越有时间把自己从过渡方案做成事实标准。
技术路线竞争经常不是“最先进者通吃”。真正先赢的,往往是那个足够好、能量产、客户敢买、供应链也愿意跟的方案。
市场上的订单就证明了这一点。1.6T可插拔光模块2026年预计出货500万到2000万只;800G在2025年已经出货超过2400万只,2026年预计跳到6300万只。英伟达3月向Coherent和Lumentum各投了20亿美元,还附带数十亿美元采购承诺。CW激光器这个CPO和高端可插拔模块共用的核心光源,订单指引也从年初约4000万只拉到约1亿只。
AI数据中心不会停下来等CPO成熟。训练集群要上线,云厂商要采购,钱会先流向今天就能交货的公司。
在当前可插拔光模块市场里,出货量全球第一的不是美国公司,也不是日本公司,而是一家总部在苏州的中国企业:中际旭创。它和新易盛、天孚通信一起,被市场称为“易中天”组合,三家合计市值超过2万亿元人民币,拿下了全球800G光模块超过40%的份额。
它们是怎么做到的,以及接下来会面对什么,AI超维度下一篇再讲。
