老李是某大厂的数据中心工程师,这两年头发白得特别快。他们团队负责的AI模型训练集群,老是卡在内存上——不是容量不够塞不下庞大的参数,就是带宽不足让昂贵的GPU“饿着肚子”等数据。他形容那种感觉就像“开着一台超跑,却动不动就堵在乡间小路上”,憋屈得很。这种“内存墙”的困局,正是驱动半导体行业绞尽脑汁、寻求最新dram工艺突破的最原始动力。而这一次,答案不再是往平面的“微缩”里死磕,而是指向了天空——垂直堆叠的立体空间。

传统DRAM的路子走了几十年,就是在平面上把晶体管和电容做得越来越小。但到了10纳米以下,这条路快走到头了:电容小到只能存不到100个电子,数据一不留神就丢;漏电大增,功耗嗖嗖往上窜-1。AI时代的模型却动辄万亿参数,对内存容量和能效的要求堪称“贪婪”。
于是,业界把目光投向了3D DRAM,也就是在芯片里像盖楼一样,把存储单元一层层垂直堆起来。想法很美好,但真干起来,难题一大堆。其中最难啃的骨头之一,就是堆叠材料——硅(Si)和硅锗(SiGe)——之间的“内应力”。它俩的晶格天生不合,层数一多,应力就能把晶圆扯弯,良率掉得没法看-1。

不过,转机来了。就在去年(2025年)8月,比利时的微电子研究中心(imec)和根特大学整出了个大新闻:他们在300毫米晶圆上,成功外延生长出了120层的Si/SiGe叠层结构,直接把之前的纪录翻了一倍-1。他们的妙招,是在工艺里掺入一点点碳元素。你可别小看这点“碳”,它就像高明的“和事佬”,能有效缓解硅和硅锗之间的晶格失配,把导致缺陷的位错密度降低了90%,让晶圆翘曲度控制在光刻工艺允许的范围内-1。这意味着,大规模、高层数堆叠的基础材料瓶颈,被撕开了一个关键的口子。这项最新dram工艺的突破,解决的正是从“能不能堆”到“能堆多高、多稳”的核心痛点,为未来实现单颗芯片内海量存储容量铺平了最初、也是最难的一段路。
当然,冲向立体空间的最新dram工艺,不止“3D DRAM”这一座独木桥。各大巨头根据自家的技术积累和判断,开出了不同的药方,场面热闹得很。
一条路是继续深化现在如日中天的“2.5D”堆叠技术,代表就是高带宽内存(HBM)。它虽然不是在单颗芯片内做晶体管级别的堆叠,但通过硅通孔(TSV)把多颗DRAM芯片像叠汉堡一样堆起来,再和GPU并排放在硅中介层上,同样是向空间要性能的高手。今年的竞争已经白热化:三星打算在2026年的ISSCC大会上展示其HBM4,带宽瞄准惊人的3.3TB/s,容量也提到36GB-2-9。更绝的是,为了进一步压榨性能,业界甚至在探索一个“疯狂”的想法:把一部分GPU计算核心,直接封装到HBM的内存堆栈底部去,让计算离数据更近,这就是所谓的“存内计算”雏形-2。
另一条路,则是对传统DRAM单元结构动大刀,搞“架构创新”。比如NEO Semiconductor公司提出的“3D X-DRAM”,它设计了两种新单元:一种是1T1C(单晶体管单电容),另一种更激进,叫3T0C(三晶体管零电容)-3。后者干脆取消了传统的电容结构,据说能提供比现有DRAM高出10倍的容量-3。而在更底层的微缩层面,“4F2”结构成为热点。它想把DRAM的核心单元(晶体管和电容)从传统的并排摆放改成垂直叠放,从而把单元面积缩小约30%-8。三星的垂直通道晶体管(VCT)和海力士的垂直栅极(VG)技术,都在朝这个方向努力-8-10。
你看,无论是材料突破、堆叠方式革新还是单元结构重构,最新dram工艺的竞赛早已不是单一维度的竞速,而是多路线、多层次的立体角逐。它解决的不仅仅是“不够用”的问题,更是“怎么用得更快、更省、更聪明”的系统性痛点。
每一次重大的技术范式变迁,都意味着一场产业链格局的洗牌。从平面转向立体,这场最新dram工艺革命,价值重心也在发生转移。
在平面微缩时代,最耀眼的明星设备是极紫外(EUV)光刻机,它决定了线条能刻到多细。但到了3D堆叠时代,舞台的聚光灯更多地打在了高深宽比刻蚀、薄膜沉积和晶圆键合这些设备和技术上-10。因为你得能刻出又深又直的通道,能均匀地沉积上百层薄膜,能把两颗晶圆严丝合缝、电性能良好地键合在一起。有分析就指出,用于键合工艺的“bonder”设备市场,规模预计将从2025年的1000亿日元激增到2030年的3000亿日元-10。
这个转变,也微妙地影响着全球竞争格局。比如,有国内券商分析就认为,由于3D DRAM技术对EUV光刻的依赖度相对降低,而对刻蚀、沉积、键合等设备需求大增,这或许为中国存储厂商提供了一个“弯道超车”的潜在机遇窗口-10。当然,机会窗口不等于成功,技术积累、量产能力和生态构建依然是巨大的挑战。但不可否认,最新dram工艺的演进,正在重塑从材料、设备到制造、设计的整个产业价值链,其影响远不止于技术参数表上的几个数字。
1. 网友“硅谷码农”提问:看了文章,感觉HBM和3D DRAM都很厉害。但对我们这些搞AI应用开发的来说,最头疼的还是训练大模型时的存储瓶颈。这些新技术,哪个能更早、更彻底地解决我们的“内存墙”痛苦?未来几年该怎么期待?
答:这位同行,你的痛我太懂了,守着算力却喂不饱数据,确实让人抓狂。简单来说,HBM和3D DRAM是解决不同层面“墙”的利器,而且会在未来几年协同作战。
HBM是“解近渴”的猛将,它主攻带宽墙。你现在训练大模型,数据在GPU显存(目前主要是HBM)和外部存储之间来回搬家的延迟和功耗,是主要瓶颈之一。下一代HBM4(预计2026-2027年上阵)带宽直奔3.3TB/s以上-2-9,搭配更先进的封装,能直接让数据管道从“省道”升级为“高铁”,大幅减少GPU等待时间。所以,未来2-3年,你会直接享受到HBM迭代带来的模型训练加速。像英伟达、AMD的新一代AI芯片,肯定会率先集成这些高速内存。
而3D DRAM则是“挖深井”的谋士,它主攻容量墙和成本墙。真正的3D DRAM旨在单片芯片内实现百层以上的存储单元堆叠,目标是提供比现在高出一个数量级的存储密度-1-3。这对于需要将超大规模参数(比如未来十万亿甚至百万亿参数模型)完全放在“近内存”中运算的场景至关重要,可以避免复杂的异构存储分层带来的效率损失。不过,它的技术成熟度和量产时间表相对靠后,业界普遍展望是在2028-2030年左右开始规模化商用-1。
所以,给你的建议是:短期(未来3年)紧盯基于HBM4/HBM4E的AI硬件平台,这会是性能提升最直接的推动力。中长期则可以关注3D DRAM的进展,它可能在未来定义新的AI服务器架构,实现真正意义上的“海量参数,就地计算”。两者结合,才能从根本上拆掉这堵“墙”。
2. 网友“硬件爱好者老王”提问:文章里提到了4F2、CBA、混合键合好多术语,感觉DRAM技术路线越来越复杂了。能通俗讲讲,这些技术之间是啥关系吗?对于我们消费者买的手机、电脑,最终会带来哪些摸得着的好处?
答:老王你好,这些术语听起来确实唬人,咱打个比方就明白了。你可以把造DRAM想象成在城市里盖公寓楼。
4F2:这是关于每户户型面积(单元面积) 的极致优化。传统户型是“大平层”(6F2结构),现在最新的设计是想改成“精巧的loft复式”(4F2结构),让同样占地面积的楼能塞进更多户人家(存储单元),密度自然就高了-8。
CBA:这是关于楼盘整体开发模式的创新。以前是盖一栋综合体,住宅(存储阵列)和物业配电房(控制逻辑电路)都混在一起建,互相干扰。CBA技术相当于把住宅楼和配套物业楼分开单独建造、分别优化,最后再用特别结实可靠的工艺(混合键合)把它们“粘”成一个整体-8-10。这样各自都能做得更好,整体性能更优。
混合键合:就是上面说的那个“特别结实可靠的粘合技术”。它不再是点几个“焊锡球”,而是让两座楼的钢筋(铜互连)直接精准对接、长在一起,连接更紧密,信号传输更快,也更省空间-5-10。这在堆叠很多层时尤其关键。
那对我们消费者有啥好处呢?最直接的就是设备更“聪明”的同时,还可能更省电、更轻薄。
手机/笔记本(AIPC/AI手机):未来搭载LPDDR6等新内存的手机电脑-2-9,能在本地更流畅地运行强大的AI助手,实时翻译、图片生成、视频处理都快如闪电,而且由于内存能效比提升,续航可能还会更好。像美光新工艺的内存,厚度还在降低,给折叠屏手机留出更多设计空间-4。
游戏/创作电脑:GDDR7显存带宽爆炸式增长-2,意味着玩8K高刷游戏、做8K视频渲染会更流畅,告别卡顿。
间接好处:云端AI服务(比如各种AI绘图、大模型聊天)因为服务器用了HBM和未来的3D DRAM,处理速度更快、成本可能更低,我们使用这些服务的体验和费用也会受益。
3. 网友“观察者小陈”提问:听说中国在先进光刻机方面被限制,那在这场最新的DRAM工艺竞赛里,中国企业是不是就完全没戏了?您提到的“弯道超车”机会具体指什么?
答:小陈这个问题非常敏锐,触及了当前全球半导体竞争的核心。首先必须承认,在传统平面微缩的赛道上,由于对EUV光刻等尖端设备的依赖,追赶者确实面临极高的壁垒。但最新dram工艺,特别是真正的3D DRAM技术,在一定程度上改变了游戏规则,创造了不同的竞争维度。
所谓“弯道超车”的机会,主要体现在两个层面:
第一,技术路线的价值重心转移。3D DRAM的核心挑战从“如何画更细的线”(极度依赖光刻),转向了“如何挖又深又直的洞”、“如何均匀地盖上百层楼”、“如何把两栋楼无瑕疵地焊在一起”-10。这对应的是高深宽比刻蚀、先进薄膜沉积、晶圆键合等设备群的重要性空前提升。而这些领域,虽然技术门槛也极高,但全球供应链的格局与光刻机有所不同,为中国设备厂商的切入和攻关提供了不同的战场和机会。国内在一些刻蚀、沉积设备上已经取得了不错的进展。
第二,架构创新的开放性。就像文章中提到的,有国内存储厂商(如长鑫存储)探索的是一种类似于早期3D NAND的路径:先采用相对简化的横向堆叠等方式,实现从2D到3D的过渡量产,快速积累技术和工艺经验,同时通过混合键合等技术整合外围电路-10。这种“先解决有无,再迭代优化”的策略,在技术范式变革初期是可行的。只要能在良率、成本和性能上找到平衡点,就有机会在庞大的市场中占据一席之地。
当然,机会绝不等于轻而易举的成功。这要求中国半导体产业在材料、设计、制造、设备等多个环节实现高强度、高协同的创新突破,并且要跑赢时间窗口。但可以肯定的是,这场最新dram工艺的革命,并没有在起跑时就关上所有的大门。它更像是一场在新的地形上展开的多维度竞赛,考验的是综合创新能力和产业生态的韧性。这其中的博弈与进展,值得我们持续关注。