HBM4因JEDEC放宽高度限制暂缓混合键合技术，采用成熟微凸点方案满足16层堆叠需求，为下一代技术争取优化时间，体现产业务实选择。 ## 1. 混合键合的必要性与技术挑战 - **堆叠需求驱动**：HBM4原计划采用混合键合实现16层堆叠（原高度限制720微米），因微凸点方案无法压缩层间间隙。 - **技术优势**：混合键合可消除层间间隙，每比特能耗降低一个数量级，但面临设备成本高、测试流程复杂（需无污染探针）和良率难题。 ## 2. JEDEC标准修改与微凸点延续 - **高度限制放宽**：JEDEC将HBM模块高度上限从720微米提至775微米，使微凸点方案可容纳16层堆叠。 - **经济性考量**：混合键合在10微米焊盘间距下成本劣势明显，推迟至HBM4E/HBM5（2027年后）更符合产业链成熟度。 ## 3. HBM4的性能与定制化升级 - **带宽与能效**：通道数翻倍，每比特能耗降30%-40%，总容量提升；接口速率略低于HBM3E但优于HBM3。 - **逻辑层定制**：基底层开放定制（如AMD/英伟达可卸载处理器任务），同时保留通用款；新增DRFM安全功能防行锤攻击。 ## 4. 混合键合的长期前景与替代方案 - **未来应用**：HBM5（本世纪末量产）或采用混合键合实现18-20层堆叠，目标带宽3.25TB/s（HBM4E为13Gb/s每针）。 - **混合方案探索**：部分采用混合键合（如裸片对键合）+微凸点堆叠，平衡技术难度与设备复用。 ## 5. 产业策略与核心结论 - **务实选择优先**：技术升级需权衡成本与需求，成熟微凸点的延续既满足AI当前需求，又为混合键合争取优化时间。 - **关键时间节点**：2026年HBM4量产与2027年HBM4E混合键合进展将决定技术过渡节奏。

2026-04-17 18:09

HBM4突然“改道”：被寄予厚望的混合键合，为何临阵推迟？

歪睿老哥©

本文来自微信公众号：歪睿老哥，作者：歪睿老哥，原文标题：《HBM4 突然“改道”：被寄予厚望的混合键合，为何临阵推迟？》

大家都知道现在AI训练对高带宽内存的需求有多疯，数据中心里数据搬运占了绝大多数能耗，HBM喂数据比普通DDR快得多也省得多，是AI时代绝对的核心内存方案。

原本整个行业都预期下一代HBM4必须上混合键合，才能做出16层的堆叠，结果JEDEC改了个规则，直接让混合键合再等一代——HBM4还是继续用微凸点，混合键合只是推迟，不是取消。今天就把这件事掰扯清楚。

1.为什么原本HBM4必须上混合键合？

先给大家理清楚HBM的基本逻辑，HBM就是把多个内存裸片垂直叠起来，靠TSV（硅通孔）垂直连通，相同面积下能塞更大容量，带宽也更高。

现在HBM已经做到12层堆叠，接下来要往16层走，之前JEDEC规定整个HBM模块的最大高度不能超过720微米，要多堆4层，就得把每一层的厚度、层与层之间的间隙都往死里压。

裸片厚度已经从原来的水平压到现在30到50微米了，TSV（硅通孔，就是给垂直连通留的孔）的间距越小，微凸点（就是层与层之间连通的焊接凸点）也得跟着变小，高度也得降。哪怕是横向的TSV间距缩小，最终都会影响到垂直堆叠的总高度。

要堆16层，原来的微凸点方案怎么挤都挤不出余量了，所以大家自然想到用混合键合——无凸点的3D堆叠方案，去掉微凸点之后，层与层之间的间隙直接没了，哪怕堆更多层，总高度也能控制住。

混合键合本身也有优势，ASE集团的工程总监Vikas Gupta说，和现在的微凸点方案比，混合键合每比特能耗能低一个数量级，性能和功耗都更好，本来就是HBM下一代的明确方向。

2.为什么又推迟了？成本和良率卡脖子

方案好归好，落地就是另一回事了，最大的两个问题就是工艺贵、良率难做。

首先混合键合需要全新的设备，单颗封装成本肯定比微凸点方案高很多，哪怕单位比特成本因为容量上去了没涨太多，首发的代价也不小。

更麻烦的是良率和测试，一整个堆叠十几颗裸片，只要有一颗有不可修复的缺陷，整个堆叠就废了，所以必须在堆叠前就测出好的裸片（Known Good Die）才能保证良率。

联电先进封装总监Pax Wang说，用微凸点的时候，焊接之前就能先测每一层内存，换成混合键合，测试流程就很难做了。

第一个麻烦，混合键合要求键合界面绝对干净，不能有任何颗粒，探针测试本身就是颗粒污染源，还可能划伤焊盘表面。现在想到的解决办法是测试后再做一次平面化修复界面，相当于多了一整套复杂工序。

第二个麻烦，原来的流程是晶圆厂把裸片发给封测厂，封测厂测完再拿回来堆叠，现在如果晶圆厂自己做堆叠，就需要自己添置测试设备，整个产业链流程都要改，不是一朝一夕能理顺的。

除了测试，过程中的检测监控也更难。yieldWerx的CEO Aftkhar Aslam提到，现在已经用到光学干涉、声学显微镜、在线微空洞检测这些手段，还要做整个堆叠的垂直溯源，把每一颗裸片的晶圆批次、老化历史、键合对齐数据全关联起来，才能把原来3D堆叠看不见的缺陷点找出来，这套体系也还在打磨。

刚好这次JEDEC把HBM模块的高度限制从720微米放宽到了775微米，一下子就留出了足够的空间，让微凸点方案也能放下16层堆叠，那自然就没必要硬上还不成熟的混合键合了。

3.HBM4的其他改进，不止堆层数

HBM4不只是堆到16层，带宽和能效也都有明显提升，表格里写得很清楚：通道数翻了一倍，接口也更宽，每针信号速率比HBM3快，只是略低于HBM3E。总容量上去之后，每比特能耗能降30%到40%，这个提升在现在AI降本增效的趋势里非常重要。

还有两个和逻辑相关的变化值得注意。

第一个是基底层（也就是整个堆叠的逻辑底die）从通用款变成可以定制了。之前所有HBM的底die都是统一规格，现在像AMD、英伟达这种大客户，可以自己定制底die的功能，把处理器的一部分工作卸载到HBM底die上，优化整体效率。当然市场上也会保留通用款给普通厂商用。

ASE的Gupta也提到，这种定制化会直接影响功耗、供电和热管理，会跟着整体计算架构一起进化。

第二个是安全和可靠性升级，HBM4加入了Directed Refresh Management（DRFM，定向刷新管理），用来防行锤击打攻击，能专门给被行锤影响的存储行做刷新，同时整体的RAS（可靠性、可用性、可服务性）也都做了改进。

通用高带宽存储器（HBM）结构

4.混合键合只是等一代，不是不用

现在HBM4的焊盘间距已经做到10微米，现有混合键合技术在这个间距下没有成本优势，所以经济上也不划算，再加上JEDEC放宽高度，微凸点刚好能撑，这才推迟了混合键合的量产。

这不是说混合键合没用了，HBM4E或者HBM5要堆18层甚至20层，要做更密的互连，还是得靠混合键合。目前预期HBM4会在2026年量产，HBM4E大概2027年跟上，三星已经给出目标，HBM4E能做到每针13Gb/s，总带宽3.25TB/s，功耗还会进一步降低。

行业现在也在探索混合方案，不一定所有互连都用混合键合：比如先把两个DRAM裸片面对面混合键合，再把一对一对的用微凸点背对背堆起来，这样既用了混合键合减厚度，又避开了全堆混合键合的难度，这种方案里传统的MR（回流焊）和TCB（热压键合）设备还能继续用。

未来要做更高更密的堆叠，不管是用哪种方案，都需要更精准的贴装设备、更稳定的超薄晶圆减薄材料，需要材料和设备一起升级，这些工作现在已经在推进了。

现在普遍预期HBM5才会大规模用混合键合，大概在本世纪末才能量产，这给了行业足够的时间打磨工艺、理顺产业链，相当于给内存产业留了一口喘气的空间。

5.总结

技术升级从来不是越新越好，一定是成本、需求、产业链成熟度共同作用的结果。原本大家都觉得HBM4必须上混合键合，结果一个标准修改，就让成熟的微凸点技术再撑一代，既解决了当前AI对容量带宽的需求，又给下一代技术争取了打磨的时间，这其实是非常务实的选择。

混合键合肯定是HBM的未来，但在它真正成熟之前，先把能用的技术用到极致，才是对产业最有利的路径。

接下来只要盯着2026年HBM4的量产进展，以及HBM4E上混合键合能不能顺利起步就够了。

AI创投日报频道: 前沿科技

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

正在改变与想要改变世界的人，都在虎嗅APP