本文拆解被资本热捧的国产GPU厂商壁仞科技,梳理其发展历程,分析其短期产能与长期产品竞争力,判断行业位置与增长空间。 ## 1. 被制裁推着走的发展历程 壁仞科技2019年成立于芯片国产替代投资热潮,累计完成7轮融资共47亿元,B轮投后估值超110亿元。2022年发布对标H100的旗舰BR100,触发美国出口管制后被迫迭代出降规的BR106,2023年被列入实体清单后台积电代工通道关闭,转产国内产线,期间核心联合创始人先后离职。2024年重启商业化,当前收入主力为双芯BR166,三款在售产品均基于2022年研发成果;2025年H20被禁后国产GPU成为刚需,壁仞作为首家港股上市国产GPU公司重新获得资本关注。 ## 2. 中短期国产GPU供需缺口巨大 国产GPU普遍落后英伟达/AMD一至两代,上游EDA、光刻设备、先进代工均受海外管制,先进产能仅中芯国际、华虹半导体可供应,产能极度紧缺,2026年AI芯片总需求约420万颗,总供给仅260万颗,供需缺口高达160万颗,缺口预计到2028-2029年才能逐步弥合,当前阶段“能规模出货就能拿到订单”。 ## 3. 短期产能配额对壁仞相对友好,但良率存风险 当前国内先进产能实行配额制,侧重战略分配而非市场化定价,壁仞作为上海扶植的本土厂商,且华虹半导体为其股东,已拿到产能准入门槛,同时提前对接华虹准备双产线方案,可随华虹7nm产能释放获得更多供应。华虹7nm先进制程仍处于投产爬坡阶段,采用DUV多重曝光工艺,良率与能效偏低,是短期出货的核心制约。 ## 4. 长期产品力有补进空间,生态尚未形成壁垒 - **硬件产品**:在售主力BR166是2022年BR100架构的双芯改款,不支持原生FP8&FP4,在显存、互联、精度上已被同行赶超,仅出货给主权AI项目,暂未获得互联网大厂大规模订单;新一代旗舰BR20X计划2026年四季度商业化,补足FP8/FP4、大内存短板,对标英伟达H200,核心瓶颈仍为新产线爬坡良率。 - **软件生态**:自研BIRENSUPA软件栈开源程度低、生态不完善,复杂场景落地问题较多,当前已转向兼容主流开源框架,可降低客户迁移成本,但长期兼容模式无法构建差异化竞争壁垒,容易陷入同质化。 - **系统交付**:壁仞仅负责GPU环节,互连、交换、整机集成均合作第三方,和多数国内同行一致,尚未在系统级交付形成差异化优势。 ## 5. 综合竞争力定位 壁仞核心优势为早期积累的单芯设计能力,当前推理芯片对内存、连接的需求提升,单芯重要性下降,软件生态、系统交付均无突出优势,但在产能配额制下具备政策扶持资格,港股上市也属于官方背书,新一代BR20X商业化在即,可为后续业绩增长提供支撑。
壁仞:国产“英伟达”,到底“几斤几两”?
2026-06-18 22:45

壁仞:国产“英伟达”,到底“几斤几两”?

本文来自微信公众号: 海豚研究 ,作者:海豚君


2026年1月2日,壁仞科技在港交所敲钟:发行顶格定价19.60港元;开盘股价飙升+82.14%,盘中一度市值突破千亿港元,收盘市值约825亿港元;公开认购超额达2,347倍,散户热情火爆。


火爆行情离不开其作为首家港股上市GPU公司的稀缺性,“国产NVIDIA”的标签更让其成为资本追捧的香饽饽。但抛开这些光环,我们关心壁仞究竟是否是一家优质的公司?


1.历程:在实体清单上长出来的公司


要理解壁仞,必须梳理其发展历程,其历程本身就是国产芯片行业的“辛酸史”。



1)2019-2022年,一级资本加注芯片国产替代。公司成立于2019年,当年美国把华为列入实体清单、海思被迫断供,一级市场将“芯片国产替代”作为投资主线。当时空缺的国内GPU市场迫切需要初创企业既要能肩负起“国产NVIDIA”的宏大叙事,又不能使投资人的真金白银打水漂。在此背景下,创始人张文带着他跨度极大的履历登场。



交大的工科、海外学的法律与商科,早期职业是律师,后转型投资人,2011年才真正进入半导体,张文组建了一支由AMD、高通、华为海思等顶级技术专家组成的GPU初创团队。


有叙事、有人才、有愿景且具备稀缺性(彼时摩尔线程、沐曦集成尚未创立),自然不乏资金追捧。在2019-2021年间,公司共完成了7轮融资,累计金额47亿元,B轮投后估值超过110亿元。



2)2022-2024年,产品惊艳亮相到产线被动“升级”。2022年8月,万众瞩目的壁仞正式发布产品BR100/104,其中BR100是旗舰产品,公司将其对标“A100的3倍以上算力、性能逼近未发售的H100”,同期自研BIRENSUPA软件栈,主讲中国版H100叙事。



但是,细看产品参数,TSMC 7nm制程、CoWoS-S封装、HBM2e,敏锐的投资者已经能够猜到接下来会发生什么了。两个月后,BIS发布出口管制新规(「ECCN 3A090」),BR100产品参数触发管制限制。


在四个月后的2023年1月,壁仞突然实现了BR106的量产,该型号是从哪儿来的?海豚君推测BR106是壁仞为绕开新规而“降规”迭代的BR104,初期大概率仍由台积电生产,但被实体清单后生产转至国内。


备注:2023年10月壁仞被定向封锁,BIS把它和另外12家中国实体列入出口管制实体清单,并加挂"脚注4",也就是代工厂要给这些客户交付产品,必须先得到许可证。TSMC代工通道彻底关闭。



从被制裁到转产国内产线量产,速度上来看壁仞还算可以。但两次制裁前后,联合创始人焦国方与徐凌杰先后离职,面对这家高估值但历经旗舰流产、产品降规、产线被迫“升级”、初创团队流失的国产NVIDIA”,资本市场的“光环”逐渐褪去。



3)2024年-至今,商业化启动


重新恢复节奏已经是2024年的事情。其中BR 166,当下100系产品中强算力的双芯配置,也是当下的收入主力,是2025年8月才开始量产的。


目前BR100产品系下有三款产品,单芯BR106,双芯BR166(收入主力),以及IoT芯片BR110。整体这三款产品其实都是2022年研发的产品。



而包括壁仞在内,国内芯片创业公司的价值重启,是在2025年上半年H20被禁,即使后续解禁,甚至H200放行后,国内云大厂的预算硬性分配到国产芯上,市场已经开始确定性认识到“国芯”已是国产替代下的“刚需品”。


那么,在新叙事强力加持下,摩尔线程、沐曦登陆科创板,壁仞、天数智芯登陆港股,剩下燧原科技同样上市在即。那么在国产芯价值重估当中,壁仞在一众同行中有什么不同,能吃多久的行业红利,未来的核心看点又在哪里?我们接着分析。


2.中短期:“出货”为王


目前,国产芯业绩其实逻辑很简单:供给为王。谁能芯片规模出货,谁就能拿到云资本开支的预算。因为英伟达在中国GPU市场从几乎100%的市占率光速接近清空、AI走到Agent时代又进一步引爆了需求,这中间留下的供需错配太大。


按照海豚君的粗略核算,这个供需差距可能要到2028-2029年,才有可能逐步弥合上。29年之后才会进入需求为主的时代。26年的需求缺口应该是40-50%上下。



1)供给:先进产能紧缺


国产GPU的单核性能弱是共识,普遍落后NVIDIA/AMD一至两代,国内常见的方案是通过各种层级(Die-Die/GPU-GPU)的数量堆叠、互联来弥补差距,但难以从根本上消除与海外晶圆厂之间的工艺差距。目前,国产AI GPU的上游仍在诸如光刻、EDA等方面存在限制:


-EDA:国产EDA龙头华大九天国内份额约15.7%,但全球份额仅为2-3%,且尚未提供数字IC全流程的套件;叠加美国对华出口EDA软件中的高端制程(7nm及以下)实施严格管制。


-光刻设备:国内仍然依赖ASML DUV进口,2025年中国加速采购以对冲管制升级,而EUV出口管制始终是最关键的卡点;


-代工:因设备限制,国内先进制程(N+2:7nm;N+3:5nm)是稀缺产能。目前国内先进产能的能力主要是在中芯国际,多数国产GPU设计厂都是排队等中芯的产能。另外一家是华虹半导体,但只是小规模量产,良率和产能有待验证。


由于产能受限,部分GPU厂商只能被迫选择N+1产线(初代7nm),但芯片性能与制程先进性高度相关,这也是产能受限下的无奈之举。


因此代工厂能拿出多少的供货,海豚君按"晶圆产能→AI产能分配→制造良率→单片裸晶数→封装良率→Die总供给“来做粗略估算。


2)需求:AI代理需求爆发


需求端看,由于AI逻辑芯片进口实质受限,国产替代成刚需。但由于目前国内产品还很难满足训练需求,因此这里主要只是核算推理端的芯片需求。


a)以阿里、字节、腾讯为代表的互联网巨头;


b)以DeepSeek、MiniMax、智谱等为代表的基础模型研发企业;因为需要一直不停消耗Token,单一需求量太大,有绕过云厂商直接提需求的权利。


以上厂商主要受益于推理需求的结构性上升,领先厂商的基础模型已将日均token消耗推至超十万亿。该部分是需求的主力军。


c)电信运营商、国企与地方政府等主权AI玩家,需求主要来自国家AI基础设施建设、数据主权、算力中心与公共部门应用。


市场需求基于国内AI开支规划,沿"客户AI/云Capex→剔除CSP海外支出→×服务器占比×AI服务器占比×加速器组件占比→AI GPU金额TAM→/ASP/算力反推卡数→GPU Die个数→CPU/GPU个数比→CPU Die个数→Die总需求"逐级推导。


总体估算下来,26年大约需要420万颗的AI芯片需求,但26年供给只有260万的供给,差距肉眼可见。



3.短期:壁仞产能锁定能力如何?


要判断壁仞短期业绩的释放爆发力,本质是分析它否能够锁定足量产能支撑起规模化出货。根据调研,在代工产能受限的当前阶段,代工产能其实是大锅饭的“配额制”:对具备成长性的厂商给予适度倾斜,避免产能在限额分配中过度向单一头部集中。


而海豚君分析后认为,当下这种计划配额制对壁仞相对二线能力(下文会具体分析为何二线)的芯片商而言,反而是好事。因为配额制分配会更加侧重战略分配,而非完全市场化定价方式。


1)获得配额的基本门槛:通关


在配额分配中,目前的硬性标准非常看重从模型一发布就能适配,考察的是软件能力。我们观察到国产AI芯片企业正与国产AI模型公司紧密合作,主动实现Day0/深度适配大模型工作。



目前这些新兴的核心芯片商都号称能在模型发布的第一时间,实现DAY 0的适配。但实际运行流畅度可能又是另外一回事。下图展示了壁仞对主流大模型的适配情况,基准门槛是通关的。



再看锁定产能的“软“条件:资金背景。


-主权资金方面,海光/寒武纪都有强势的国资(中央)背景,有望优先受益于中芯国际的先进产能(最高优先级仍是华为);而上海地方同时扶植了壁仞/沐曦/燧原三家本地厂商,壁仞并非"独宠"。



-产业方面,燧原/寒武纪在IPO前分别有腾讯/阿里入主,在需求侧相较于壁仞更有保障;而目前壁仞并无强绑定的大厂关系。


虽然没有独特的“深厚关系”,获取肯定还是能拿到的,毕竟:


其一,对于地方而言,各家厂商手心手背都是肉、难以偏废,其介入本就会使二线厂商有望获得优于纯市场化结果的产能份额。


其二,华虹国际(上海市国资委(51.59%)、上海国盛(18.36%)、上海国际集团(18.36%)、上海仪电(11.69%))以"现有少数股东的紧密联系人"身份出现在壁仞的配售名单中(尽管份额仅0.13%),也就是说晶圆厂就是它的股东。


而调研也证明,壁仞已经开始接触除中芯国际以外的晶圆厂,并准备了两套产品方案。我们认为随着华虹7nm逐步投产,壁仞将随着华虹的产能释放逐步获得晶圆供应。


2)为什么良率可能成为制约?


尽管存在上述利好,难改中芯国际(先进产能的大头)的排产优先级并不面向壁仞的事实,我们判断未来产品主要的供应仍将来自华虹,但华虹的先进制程目前仍处于投产初期,产能有待爬坡。


该工艺通过DUV多重曝光实现,而非EUV,这将导致芯片的良率与能效相对偏低,进而拖累出货能力,是短期最关键的风险点。


4.长期:壁仞长线能跑赢吗?


进入长期,比拼的就是各家厂商的产品力,产品力的维度目前来说分为三个大的维度:


a.单芯能力:基础参数、迭代速度;


b.芯片软、硬结合与生态能力;


c.系统级方案的交付能力。


目前国内玩家中,除了海思有比较强的系统化交付产品和能力,其他都还集中在芯片这个单一问题上。单看壁仞:


1)基于GPGPU的硬件系统;


2)软件平台BIRENSUPA;



1)基于GPGPU的硬件系统


主流的AI智算芯片类型上,有ASIC、FPGA与GPGPU三种路径。公司主营自研GPGPU芯片、加速卡、整机服务器,采用Fabless模式,将晶圆制造和封装测试外包给第三方代工厂。



目前壁仞已量产BR106/BR110/BR166三款GPGPU芯片,以PCIe板卡与OAM模组落地,产品的核心规格信息整理如下:



自BR100/104流产后,公司不再公布产品具体的可比参数规格。根据光大证券,其单芯片(BR100/BR104/BR106)性能在国产芯片中表现优异,支撑起芯片总体出货量同比增长+273%。但以上都是历代产品的数据表现,海豚君更关注的是旗舰产品BR166与BR20X。



a)BR166够打吗?


BR166其实就是BR106的双芯版,算力翻倍,架构其实不变,而BR106的原本架构就是2022年的BR100。


按招股书所说,「我们利用芯粒技术将两个BR106裸晶和四个DRAM集成到一个封装中…两颗BR106裸晶之间的D2D(裸晶间)双向带宽可高达896GB/s。」架构(下图为BR100架构,BR166除内存披露为DRAM外延续此架构)如下所示:



彼时来看,壁仞为了做AI智算场景,设计架构上还是颇具创新的,高算力搭配超大的片上L2缓存(H100仅50MB,BR100高达256MB)。


微架构设计上,我们知道SM是NVIDIA的基本调度粒度,类似壁仞的SPC下还有更小的EU单元,支持对4/8/16 EU的动态调度粒度组合,可以根据工作负载特性在更细粒度上做资源复用。


算力(矩阵吞吐量)上,每个EU配置1个T-Core(1 SPC有16个T-Core并行计算);Hopper架构下单SM是4个Tensor-core;这个是更适合国产良率下Chiplet的方案。



当下来看,不支持原生FP8&FP4数据格式是最大的硬伤,没有低精度数据格式意味着在大模型训练推理场景的效率上存在先天劣势,而这在大模型训练推理任务中已大范围应用。


在国内同行中,由于BR100是2022年的产品,单芯算力还算可以,主要在片间互连、显存带宽与容量、计算精度等方面已被友商赶超,其中昇腾910C基本对标H100,而沐曦/燧原的产品综合性能已经介于H100-H200之间,BR166的产品力已略显不足。



我们观察其下游合作伙伴(黄底意味着交付)进行印证,壁仞的产品主要出货给运营商/智算中心等主权AI项目,并没有CSP的大规模订单。一个很大的原因,是CSP们部署的都是推理需求,当下Agent推理要的是大内存、强连接。壁仞当下产品线这方面比较薄弱,因此综合实力上BR166不是一个非常能打的产品。



除了产品力不足这一潜在因素外,我们在第1节中对壁仞曲折的发家史已经进行了梳理,地缘政治因素导致了供应链的不确定性,使得公司无法向互联网客户证明其具备长期、稳定、大批量供货的能力。



不过需求过旺情况下,这些短期是不大问题:从财报来看,订单、预付款、备产三个维度的财务数据侧面印证了壁仞下游需求的确定性是存在的。


-在手订单:据招股书披露,其框架销售协议及销售合同中未完成的、具约束力订单总价值达8.22亿元,为后续收入提供确定性基础。


-合同负债:2025年末合同负债达0.77亿元,已有客户以预付方式锁定订单。


-存货:2025年末存货净额达9.49亿元、同比增长超500%,且结构上以原材料(3.86亿元)与在制品(4.31亿元)合计占比约85%,表明存货扩张源于确定订单。



b)BR20X怎么看?


BR166综合竞争力不突出,但站在2026年的节点上,按照3-4年产品大迭代一次来看。新一代旗舰产品BR 20X系产品推出在即。节奏上:


(1).BR20X系列:目前正在进行物理设计及流片验证,计划2026年四季度开启商业化。公司将在提升单芯片能力的同时加快推进超节点系统。


(2).产品参数:作为供应链完全转向国内而免受管制的下一代旗舰产品,演进方向上符合我们预期:


-FP8&FP4将在BR20X系列配备,加速公司适配大模型训练推理需求;


-提供更强的算力;


-配备更大更快的内存、更高速的互联带宽及超节点系统设计。


具体规格上,我们估计BR20X将对标NVIDIA H200,具体参数没有公开信息。海豚君以参考对标的产品以及调研信息,对BR20X估计如下:



新产品主要是补了内存容量的短板,但连接上应该还是需要改善。但总体来说,由于补足了之前的缺点,新产品从产品侧是能够拿到大厂的订单的。关键矛盾,还是新产线爬坡的良率。


2)软件平台BIRENSUPA


如果说硬件方面,各大芯片设计厂商正在尝试各种方案缩小与NVIDIA的代差,那在软件方面,CUDA就是所有厂商都无法绕开的一堵高墙。CUDA的壁垒不必过多赘述:先发优势积累的护城河、软硬件深度绑定带来极致性能优化与软件兼容、丰富的工具库等。


国内厂商的应对大体分两条路线。一是采取兼容CUDA的模式,如摩尔线程的MUSA/沐曦的MACA,他们都以此作为商业化的卖点。二是以华为CANN/寒武纪Neuware为代表的全栈自研,前者通过超5年的算子积累深度绑定了主权订单,后者在推荐系统场景垂直深耕,收获字节等头部CSP的锁定。壁仞创立之初也计划走自研生态。



BIRENSUPA的开源程度与软件栈的丰富度上短板明显,生态建设仍处于早期阶段;且在工程落地面临摩擦成本。调研指出,在复杂场景下,BIRENSUPA可能仍需手动修改底层IR代码或出现编译报错率偏高的问题,部分通信库在千卡集群中的同步延迟也需要调优。



为了补短板,壁仞打算把IPO募资的40%用于优化软件栈生态,且在PyTorch、vLLM、SGLang等主流开源框架逐步提供了全面支持,使其能够进入CUDA生态构建的庞大存量市场,降低客户迁移成本。


短期来看,壁仞由自研生态转向兼容的取舍是合理的,其规模体量/客户结构/商业化能力都无法支撑其继续埋头走自研道路。毕竟对于客户而言,最终评判核心是解决方案的性价比,这是一个软硬件结合的体现。


但站在更长期视角,兼容本质上并不能带来竞争壁垒,乐观的推演下是壁仞作为中间层做得比其他厂商更具优势,但如果壁仞不能在软件易用性、稳定性和第三方生态建设上建立差异化,可能很快就会陷入同质化竞争。


3)超节点:有方案吗?


壁仞的产品以GPU集群/超节点为交付形式,但其在交付方案中的价值量仅在于GPU环节,互连、交换、整机集成的价值量让渡予曦智、中兴等上下游伙伴。


行业,国产厂商除华为已实现了全栈自研,多数在互连通信的自研布局上仍处于起步阶段(仅在卡间互连协议实现自研),在交换芯片(对标NVSwitch)、整机柜系统集成环节多与上下游厂商合作。


而目前各家的研发重心放在了算力芯片、软件栈之上,互连尚未形成差异化竞争。但互连技术在AI时代的价值被显著放大,Scale-up/out/across能力将决定单节点能够承载的模型体量。


我们认为能够率先“交钥匙”的公司将利于自身长期生态壁垒的构建,壁仞与创业公司同行没有本质差异。



5.综合来看,壁仞在同行当中,主要差异化是单芯能力。但其实当下推理芯片的核心单芯重要性其实在下降,算力模块上的内存和连接也变得越来越重要;系统化超节点交付方案上没有差异,还都在初级阶段;在关键的软件生态上也是几家当中不太突出的。


但它好的地方在于,在“产能配额”模式下,它具备种子选手,持续被政策扶持的实力,本身能够港股上市,其实也是一种官方背书的体现。而且短期来看,BR 20X商业化在即,也能为接下来的业绩释放提供非常好的接力棒。

AI原生产品日报频道: 前沿科技
本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定