摩根士丹利报告认为,中国AI GPU与美国的差距小于市场预期,2026年或成产业拐点,系统级优化和本土产能扩张将推动自给率从2024年33%提升至2030年76%。 ## 1. 中美AI GPU差距的真相 - **能效经济性缩小差距**:中国低电力成本降低能效权重,以"每美元每瓦性能"衡量差距更小。 - **制程瓶颈与替代路径**:受限于光刻设备及EDA工具(华大九天份额仅1-2%),厂商转向多芯片集成、系统架构优化及SMIC N+2工艺(2026年产能4万片/月)。 - **关键结论**:单芯片性能落后,但封装/集群/规模三路径可抵消劣势,系统级差距或从1.5-2倍缩至1倍。 ## 2. 本土需求与商业化驱动 - **双引擎驱动**:技术自主化(国家安全)与商业回报(2026年AI资本开支达5970亿元,同比+38%)共同拉动需求。 - **市场结构**:2030年市场规模670亿美元(CAGR23%),云厂商(51%占比)、主权买家、创新企业为主力,推理场景优先承接国产芯片。 - **关键数据**:2030年AI算力设施利润率或达50%,自给率从33%升至76%。 ## 3. 竞争格局与胜出关键 - **评估框架**:定性(产能/客户/政策/技术)+定量(TPS、每token成本、每瓦性能),华为或获最大先进产能份额。 - **推理经济性优势**:国产芯片采购价低30-60%,总成本接近H20/A100,Ascend 950/MLU690部分场景性能可比。 - **行业整合趋势**:后期拼规模效应与成本控制,当前高估值反映替代预期而非盈利确定性。
大摩最新研判:中美AI GPU差距,没想象那么大
2026-03-16 19:14

大摩最新研判:中美AI GPU差距,没想象那么大

本文来自微信公众号: 硅基观察Pro ,作者:硅基君


前两天,大摩发了一份挺有意思的报告,标题也很直接:《中国AI GPU——缩小与美国的差距》。


报告里有一个核心判断,其实挺颠覆很多人的直觉:中国AI芯片和美国的差距,并没有市场想象得那么大。


更关键的是,大摩还提出了一个时间判断——2026年,可能会成为中国AI GPU产业的一个重要拐点。


为什么这么说?


原因不只是技术在进步,更重要的是,国内新一轮AI GPU公司正在走向资本市场。比如百度旗下的昆仑芯、阿里体系里的平头哥,都将在未来一两年进入IPO阶段。


在这份报告里,大摩系统拆解了中国AI GPU产业,并试图回答三个核心问题:


第一,中国是否能够大规模供应具有竞争力的AI GPU?


第二,中国AI GPU市场到底有多大?


第三,投资人应该如何评估中国AI GPU公司的商业价值?


接下来,我们就沿着这三个问题,一起看看大摩是怎么说的。


/01/


差距没有想象那么大


很多投资人在讨论中国AI GPU时,往往只盯着晶圆工艺节点,然后很快得出一个结论:中国AI芯片在制程上落后一代甚至几代,因此竞争力有限。


但大摩提出了一个相对不同的判断:中国AI芯片与美国的差距,其实没有市场想象得那么大。


原因很简单。中国的电力成本相对更低,因此能效在整体算力经济模型中的权重,并不像欧美那样高。


如果从“每美元每瓦性能”(performance per watt per dollar)的框架来看,这种差距会明显缩小。


要判断中国AI GPU是否能够真正实现规模化供应,关键还是要回到半导体产业链的供给侧——尤其是晶圆厂产能。


在这一层面,产能扩张不仅取决于晶圆厂的名义产能,还取决于一系列关键上游投入的成熟度和可获得性。而现实情况是,中国AI GPU产业链仍然受到多重供应瓶颈的制约。


这些瓶颈最明显地体现在晶圆前端设备(WFE)上。


在部分设备领域,中国已经取得一定进展。例如外延设备和刻蚀设备等关键工具,已经可以由本土厂商提供,包括北方华创、中微公司以及SiCarrier等。


但在光刻设备和检测设备方面,制约仍然非常明显。


目前,中国晶圆厂仍大量依赖ASML的DUV光刻系统。同时,行业调研显示,在SMIC的先进制程产线(尤其是南方厂区),KLA的检测与计量设备供应受限,这迫使晶圆厂减少检测步骤,将资源集中在最关键的层级。


这种做法可以提高设备利用率、维持产能,但往往以牺牲良率为代价,也加剧了先进制程制造的结构性挑战。


除了设备,EDA(电子设计自动化)软件同样是关键瓶颈。


目前,中国最大的EDA公司华大九天在全球市场的份额仅约1–2%。更重要的是,其尚未提供完整的数字芯片设计工具链,很难支持先进节点GPU的复杂设计。


相比之下,Cadence、Synopsys和Siemens三家公司在全球EDA市场的份额合计超过80%。


与此同时,美国政府已经对先进EDA工具实施严格出口管制,尤其是用于GAA(全环绕栅极)晶体管架构的设计工具。这些限制的目标很明确:


阻止中国推进3nm和2nm节点,而这些节点正是未来高性能计算和AI芯片的关键基础。


在设备与软件双重限制下,中国GPU设计公司在短期内很难向3nm或2nm制程迁移。


在这种背景下,中国AI芯片产业正在出现一个明显变化:


瓶颈正在从设备获取,转移到晶圆代工产能本身。


目前,中国先进逻辑制造能力高度集中在SMIC,这使得SMIC成为国内AI GPU产能扩张的关键节点。


根据行业调研,多家国内AI芯片厂商已经开始将部分生产从海外迁回中国大陆,利用SMIC的N+1(约12nm)和N+2(约7nm)工艺节点来提升本土产能。


目前,SMIC已经通过DUV多重图案化技术将工艺推进至N+2,并尝试向N+3(约5nm)节点演进。


大摩预计,SMIC的N+2产能将在2025年达到约2.2万片/月,2026年约4万片/月,2027年约5.1万片/月。


不过,这些产能并不会全部用于AI GPU,因为智能手机、汽车SoC等行业同样需要先进节点。


在晶圆工艺难以快速追赶的情况下,中国AI芯片厂商正在逐渐改变竞争路径——从单芯片性能转向系统级架构设计。


目前主流的应对策略大致有三类。


第一,是多芯片集成。


如果单个芯片性能不足,就通过先进封装技术,将多个计算芯片整合在一起,形成更大的计算单元。这种方式不依赖更先进的制程节点,也能够在一定程度上提升整体算力。


第二,是扩大系统规模。


国内厂商正在借鉴NVIDIA NVL72的架构理念,通过更大的机架和集群来提升整体性能。例如华为的CloudMatrix 384、阿里巴巴的PPU架构,以及字节跳动的256加速器机架设计,本质上都是通过规模化架构来弥补单芯片性能差距。


第三,是扩大制造规模。


近年来,中国晶圆代工厂持续加大资本投入。SMIC的资本开支在2023年约75亿美元,2024年约73亿美元,2025年约81亿美元。同时,中国也在加速采购ASML的DUV光刻机,以支撑未来先进节点产能扩张。


换句话说,在单芯片性能难以迅速追赶的情况下,中国厂商正在通过封装、架构和规模三条路径来弥补差距。


虽然单芯片性能仍然落后,但在大规模集群和推理场景中,这种系统级优化,已经能够在一定程度上抵消硬件层面的劣势。


/02/


国产AI GPU的需求有多大?


在讨论中国AI GPU产业时,一个经常被忽视的问题是:需求到底有多大?


在大摩看来,需求侧核心取决于两个驱动力:技术自主化与商业回报。


先看技术自主化。随着外部限制不断加强,AI芯片已经被中国视为关乎国家安全与经济安全的关键资源。这种压力直接推动了中国建设本土AI芯片体系的决心。


在这一过程中,产业链内部形成了一种典型的共生关系。


一方面,本土AI芯片公司需要先进制程节点支持。GPU要具备竞争力,通常需要领先两到三代的制程工艺。另一方面,本土晶圆厂也需要稳定的大客户与订单规模,才能证明先进制程投资的合理性。


在这种结构下,晶圆厂产能成为整个产业链最关键的瓶颈。


不过,大摩认为,自主可控更多是早期投资的驱动力。长期来看,AI芯片产业能否持续发展,最终仍要看商业回报。


随着算力投资规模不断扩大,资本开支与设备利用率迟早会成为约束条件。因此,中国AI产业的路径正在发生变化:


从“政策驱动”,逐渐转向成本效率与商业回报驱动。


目前,中国主要科技公司——腾讯、阿里巴巴、字节跳动、百度、美团和快手——都在明显提高AI资本开支。


大摩预计,到2026年,中国科技公司的AI相关资本开支将达到5970亿元人民币,同比增长约38%。


这些投入主要集中在广告推荐、消费应用(2C)和企业服务(2B)等场景,而这些场景已经逐渐证明具备清晰的商业化路径。


从长期经济模型来看,在扣除折旧、电力和服务器租赁成本之后,中国AI算力基础设施预计将在2028年前后实现盈亏平衡,到2030年整体利润率有望达到约50%。


从需求结构看,中国AI GPU的采购高度集中在少数大型买家。


大摩将其分为三类。


第一类是云服务商(CSP),包括字节跳动、阿里巴巴和腾讯。这些公司采购GPU既用于训练自有模型,也用于向外部客户提供AI云服务。


第二类是主权买家,包括电信运营商、地方政府和国有企业。这类需求主要来自数据主权、数字基础设施和公共服务数字化。


第三类是创新企业,例如DeepSeek、MiniMax等AI创业公司,以及小鹏、小米等汽车厂商。不过目前来看,这类企业的采购规模仍明显小于前两类。


综合这些需求,大摩预计中国AI GPU市场规模将持续快速增长。


到2030年,中国AI GPU市场规模(TAM)预计将达到670亿美元,2024年至2030年的复合增长率约为23%。


这一测算主要基于中国云计算行业的资本开支结构。


大摩预计,到2030年,中国云计算行业整体资本开支将达到1300亿美元,其中约51%将用于AI GPU相关设备。


这一预测基于几个关键假设:


第一,中国云厂商海外数据中心投资比例将逐渐下降。2025年,中国云厂商约40%的算力投资用于海外数据中心,但这一比例预计将在2026年以后下降至约30%。


第二,服务器仍将占云计算资本开支的约90%。


第三,AI加速服务器占比将从2025年的75%提升至2030年的85%。


第四,在AI服务器中,加速器芯片的价值占比约为80%。


不过,随着中国AI GPU市场规模不断扩大,一个更关键的问题也随之出现:这些需求最终会流向谁?


大摩的判断是,在持续的地缘政治压力下,中国AI算力需求正在快速本土化。


这意味着,本土芯片将不再只是出口管制下的替代方案,而会逐渐成为中国AI算力体系的结构性组成部分。


尽管中国在制程技术上仍落后美国数代,但系统级性能差距正在逐渐缩小。


未来四年,这一差距有望从目前的1.5—2倍,缩小至约1倍左右。


推动这一变化的,并不是制程节点本身,而是三个因素:


先进封装技术(例如2.5D和3D封装)、大规模系统架构(例如光互连网络)、软硬件协同优化。


与此同时,中国也在逐步降低对TSMC代工的依赖,更多转向SMIC的N+2和N+3工艺。


当然,一些关键环节仍然依赖海外供应,例如韩国的HBM存储、欧洲的DUV光刻设备,以及美国KLA的检测设备。


不过,大摩的行业调研显示,在部分环节,中国已经开始逐渐取得突破。


综合供需两侧变化,大摩认为中国AI芯片产业正在形成一条清晰的自给路径。


到2030年,中国AI芯片自给率预计将从2024年的33%提升至约76%。与此同时,本土AI芯片市场规模也将从2024年的60亿美元增长至2030年的510亿美元,复合增长率约为42%。


这一增长主要来自三个因素:先进节点产能扩张、制造良率持续提升和以及政策主导的资源配置。


例如,大摩预计中国先进节点晶圆厂的生产良率将从2025年的约20%,提升至2030年的约50%。


同时,由于先进节点产能仍然稀缺,政府在一定程度上会参与产能分配。


在大摩的判断中,华为预计将获得最大的先进节点产能份额,其次是寒武纪和海光,而第二梯队AI芯片公司的产能份额可能各自低于10%。


/03/


谁能胜出?


市场的主流看法是,中国AI GPU的落地,主要还是靠政策推动下的国产替代。


在这种叙事框架里,很多厂商的估值逻辑其实很简单:


第一,未来能从NVIDIA手里拿走多少市场份额;


第二,中国市场会不会长期维持一个分散竞争的格局。


但大摩的判断并不完全一样。


他们认为,中国AI GPU厂商的长期价值,最终还是要回到两个问题:


第一,产品有没有真正的商业竞争力;


第二,这种竞争力能不能转化为稳定收入和品牌溢价。


政府支持、CSP定制采购当然重要,但如果拉长周期看,真正决定市场地位的,还是产品本身。


基于这个逻辑,大摩提出了一套“定性+定量”的评估框架。


定性层面看四件事:能不能拿到先进制程产能、和核心CSP客户关系是否稳固、政策支持力度,以及技术路线是否符合未来需求。


定量层面,则重点看四个指标:TPS(每秒token输出能力)、每瓦性能、每美元每瓦性能,以及最关键的每token成本。


从行业趋势看,中国AI GPU市场大概率会逐步走向整合。


原因其实很简单。一方面,随着技术成熟,产品差异化会逐渐缩小;另一方面,规模效应会越来越重要。


到了后期,竞争不再只是拼参数,而是拼出货量、客户黏性、供应链能力以及成本控制。


换句话说,GPU最终会变成一个典型的规模行业。这也意味着一个结果:


利润率压力会越来越大。


因此,大摩认为接下来最值得关注的三个指标是:


第一,新一代芯片规格是否持续提升;


第二,向头部CSP的出货量能否快速增长;


第三,ASP和毛利率的变化趋势。


如果这些指标走弱,当前市场给出的高估值很可能会面临修正。


当然,这套判断也有可能失效。


例如,如果国产GPU厂商始终拿不到足够的晶圆厂产能,那么产品再好也很难兑现收入。


或者CSP对国产芯片的采用意愿低于预期,采购仍然倾向海外供应商。


更深层的风险,则是AI计算范式本身发生变化。比如模型架构或工作负载发生重大变化,导致当前基于TPS的性能比较不再有效。


从这个角度看,一个真正可能成为长期赢家的中国AI GPU厂商,至少需要同时具备四个条件:


第一,推理经济性有竞争力;


第二,能够稳定拿到先进节点产能;


第三,与核心CSP客户形成深度绑定;


第四,在政策方向上处于有利位置。


缺任何一项,都很难长期维持市场份额,更难支撑高利润率。


在具体分析方法上,大摩采用的是一个“双层框架”。


第一层看定量指标,也就是推理经济学。


对于CSP来说,决定是否大规模部署的,往往不是峰值性能,而是规模化后的总拥有成本。


真正关键的指标,不是芯片跑分有多高,而是推理场景下的每token成本、TPS、每瓦性能,以及每美元算力。


第二层看定性定位。


也就是厂商是否能把实验室里的性能,真正转化为商业市场的份额。这取决于三件事:是否能拿到先进节点产能、是否进入主流CSP采购体系,以及是否契合政策方向。


从需求结构看,中国AI GPU的主战场,短期内更可能是推理,而不是训练。


原因很现实。本土厂商在生态和制程上仍然受限制,要全面参与最前沿基础模型训练仍然有难度。


相比之下,推理需求正在快速增长。


像DeepSeek、豆包、Qwen这样的模型,日均token消耗已经达到很高水平,持续拉动推理算力需求。


与此同时,大量NVIDIA A100以及部分H100、H800集群仍然主要用于训练任务。


这意味着,中国新增的推理需求,很可能越来越多由国产加速器承接。


在推理场景的性能比较中,大摩更看重TPS,也就是每秒token输出能力。


因为在真实部署中,TPS往往比理论峰值算力更接近商业价值。


它同时反映了计算吞吐量、内存带宽、互连能力以及软件栈优化水平。


从推理经济学来看,国产芯片的优势主要在成本结构。


整体来看,本土AI加速器的采购价格通常比中国市场可获得的高端NVIDIA产品低30%到60%。


如果再把功耗、电费以及运维成本算进去,国产方案的总拥有成本通常更低。


这意味着,虽然NVIDIA H200在绝对性能上仍然领先,但在“每token成本”这个更贴近商业现实的指标上,头部国产厂商已经可以做到接近H20和A100。


在部分配置下,甚至可能更优。


这一点非常关键。


因为对于CSP来说,真正决定是否部署的,不是芯片峰值性能,而是能不能用更低成本完成更多推理任务。


换句话说,国产GPU未必要在硅性能上全面领先,只要在规模化部署中具备更好的经济性,就足以建立商业价值。


从TPS表现来看,最新一代国产加速器已经开始逼近甚至在某些场景下超过NVIDIA H20。


例如华为Ascend 950系列以及寒武纪MLU690,在部分推理场景中的表现已经具备一定竞争力。


当然,这种比较也有边界。


TPS不仅受硬件参数影响,还与软件优化、框架适配以及集群配置有关。


换句话说,参数接近并不等于实际部署效果完全相同。


更重要的是,这种比较必须放在中国可采购产品的范围内理解。


如果把NVIDIA最新的GB300平台纳入比较,性能差距会再次被拉开。


也就是说,中国厂商确实在追赶,但当前追赶的主要是中国可获得市场,而不是全球技术前沿。


除了性能,能效也是重要指标。


虽然中国整体能源约束不如美国严格,但能效仍然会影响部署密度和机房成本。


从每瓦性能来看,头部国产芯片已经接近A100和H20,但与H100、H200仍存在差距。


不过,如果把采购价格纳入考虑,国产芯片的性价比优势会更加明显。


因此,在推理密集型场景中,国产GPU的吸引力正在不断增强。


市场最终奖励的,很可能不是峰值性能最高的厂商,而是那些能够持续压低每token成本、并把这种优势规模化复制的公司。


从更宏观的角度看,美国AI GPU公司的估值逻辑已经比较成熟。


像NVIDIA和AMD,估值虽然不低,但核心支撑来自规模、盈利能力以及全球生态位。


相比之下,中国AI GPU厂商的估值明显更激进。


很多公司收入规模仍然较小,盈利能力也还处于早期阶段,但市场已经给出了很高的PS倍数。


本质上,市场交易的不是当前利润,而是国产替代和未来市场集中度的预期。


因此,中国AI GPU板块更像是在定价一张长期竞争格局,而不是确定性的盈利能力。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定