一块看似普通的存储芯片,却承载着连接计算与存储两大世界的历史使命,它的故事远比我们想象的曲折。
在犹他州的李海晶圆厂,20纳米制程工艺下诞生的128 Gbit容量芯片,是英特尔与美光在2015年夏天联手抛向存储行业的一枚重磅炸弹-1。

当时两家公司声称,这项名为3D XPoint的非易失性内存技术,能够在DRAM与NAND闪存之间的鸿沟上架起一座桥梁-9。商业品牌分别命名为英特尔的“Optane”(傲腾) 和美光的“QuantX”-1。

2015年的存储行业正处在一个技术瓶颈期。DRAM速度快但价格昂贵且数据易失,NAND闪存成本低但速度慢且使用寿命有限-9。存储技术行业迫切需要找到一种能够平衡性能、成本和持久性的解决方案。
当英特尔和美光联合发布3D XPoint技术时,整个行业都为之震惊。他们宣称这项技术比NAND闪存快1000倍,存储密度提高了10倍,而成本低于DRAM-6。
更关键的是,它采用了一种全新的存储机制——通过材料电阻变化实现数据存储,采用三维棋盘式交叉点结构-1。存储单元里没有晶体管,只有选择器和存储元件组成-3。
深入探究3D XPoint的工作原理,会发现它与传统存储技术有本质区别。NAND闪存通过捕获电子在浮置栅极中来定义比特值,而3D XPoint是一种基于电阻的存储技术-9。
每个存储单元可以在高电阻和低电阻状态之间切换,这种切换对应着数据的0和1-9。选择器的作用是在交叉点阵列中精确定位要读取或写入的存储单元,防止“潜行电流”干扰未选择的单元-2。
这种结构使得3D XPoint能够以比特为单位进行寻址,而不像NAND那样必须以页面(通常16KB)为单位进行操作-9。这一特性让它在某些应用场景下具有天然优势。
从实验室走向市场的道路并不平坦。2017年,英特尔发布了基于3D XPoint技术的“Optane SSD DC P4800X”固态硬盘和“Optane Memory”内存产品-1。
最初的商业策略是将3D XPoint定位在DRAM与NAND之间的位置——比DRAM便宜,比NAND快-9。但实际推向市场时遇到了多重挑战。
制造工艺复杂,随着层数增加,成本急剧上升。当层数增加到类似3D NAND的64层时,每比特成本会暴增到单层的50倍-8。这使它在成本上难以与成熟的3D NAND技术竞争。
3D XPoint技术的核心是相变存储器(PCM)单元和Ovonic阈值开关(OTS)选择器的组合,形成所谓的“1S1R”结构-2。正是这种结构埋下了技术挑战的种子。
随着制造工艺的不断缩小,相邻存储单元之间的热干扰问题变得突出-3。由于相变存储元件使用热量进行重写操作,当一个单元被加热时,相邻单元也会受到影响,可能导致数据被意外重写。
另一方面,增加堆叠层数意味着工艺步骤显著增加。每一层都需要7层材料沉积,4层堆叠就需要28层成膜工艺-3。这直接导致了制造成本的大幅增加和良率的下降。
美光在2021年3月暂停了3D XPoint的开发,而英特尔在2022年7月完全退出了这项业务-3。商业上的挫折标志着第一代3D XPoint技术暂时告一段落。
分析认为,缺乏足够大的市场和无法实现规模经济是导致企业退出的主要原因-4。尽管技术有潜力,但要在现有存储市场中找到自己的位置并不容易。
有意思的是,铠侠(原东芝存储器)对3D XPoint技术的长期前景并不看好-8。他们认为,与传统3D NAND技术相比,3D堆叠存储类内存的成本优势有限,且面临更多技术挑战。
商业上的挫折并没有阻止技术的演进。在3D XPoint的基础上,研究人员发现了OTS选择器本身具有记忆效应,这催生了“仅OTS存储器”的新概念-2。
这种新型存储器利用了OTS材料的一个特性:阈值电压会根据前一个脉冲的极性发生变化-5。换句话说,这个元件能够“记住”前一个脉冲的极性,即使数小时后仍然有效。
这一发现打开了新的大门。三星、SK海力士和美光等主要存储公司都在积极研发这类新技术-3。三星已经利用16纳米制程技术制作了64Gbit大容量“仅选择器存储器”原型-3。
目前,基于OTS的存储技术正在朝着CXL(计算快速链路)内存的方向发展-2。CXL是一种开放行业标准互连,可在高性能计算应用中的内存和处理器之间提供低延迟和高带宽连接-5。
对于CXL型应用,功耗和耐用性是最关键的参数,而保留时间则可以做出妥协——几小时或几天的保留时间就足够了-5。这与传统的DRAM应用有明显的区别。
Imec开发的仅OTS存储器件展示了超低的写入电流(<15 µA),比典型的相变存储设备降低了约10倍的能耗-5。同时,它们保持了快速读写操作(短至10纳秒)和合理的耐用性(>10^8个周期)-5。
当地平线上出现“仅OTS存储器”的曙光时,半导体行业仍未放弃填补DRAM与NAND之间鸿沟的理想。毕竟人工智能和大数据时代对存储性能提出了更高要求。
当三星展示64Gbit原型,当美光基于第二代3D XPoint技术制作256Gbit大容量存储芯片,当SK海力士推出32Mbit的硅芯片,存储行业的探索从未停止-3。
或许正如一位分析师在2015年所预测的:“3D XPoint的作用并非取代NAND,而将被用于充当服务器内的一类持久性高速内存,从而将相当一部分负载从DRAM当中释放出来。”-6 这条道路上仍有许多技术高峰等待攀登。
这是一个非常实际的问题。虽然3D XPoint作为商业产品已经退出市场,但它留下的技术遗产正在以新的形式延续。今天研究机构和企业关注的“仅OTS存储器”、“自选择存储器”等技术,实际上是在解决3D XPoint遇到的核心问题。
就拿制造复杂性来说吧,原始的3D XPoint需要将选择器和存储元件串联,形成复杂的“1S1R”结构-3。而现在的研究发现,OTS选择器本身就有记忆功能,这意味着一个元件既能当选择器又能当存储器,大大简化了制造工艺-5。
对于担心能耗的用户来说,新技术也带来了实实在在的好处。Imec开发的仅OTS存储器件写入电流不到15微安,比传统相变存储器件降低了约10倍的能耗-5。在数据中心这种对能耗极其敏感的环境里,这种改进意义重大。
最重要的是,这些新技术正在瞄准一个不断增长的市场——CXL内存-2。随着人工智能和大数据分析应用爆发,传统存储架构已经跟不上需求,这就为新型存储技术创造了机会。
技术进步的最终目的都是服务于人,这些存储新技术也不例外。最直接的体验可能就是电子设备的响应速度更快、电池续航更长。
想象一下,未来你打开手机上的大型应用或游戏时,加载时间可能会大幅缩短。这是因为新型存储技术可以缩小内存与存储之间的速度差距,让数据访问更加高效。
对于经常使用笔记本电脑的用户来说,设备突然断电导致工作丢失的情况可能会减少。由于这些技术具有非易失性,即使在断电情况下也能保持数据-7,这比传统DRAM需要持续供电维持数据要可靠得多。
从更广泛的角度看,这些技术进步将推动整个计算生态的发展。更高效的存储系统意味着数据中心可以处理更多数据,同时消耗更少能源。这最终会降低云服务的成本,使我们日常使用的各种在线服务更加便宜、快捷。
“存储级内存”这个术语听起来很专业,但其实可以用一个简单的比喻来理解:如果你的电脑是一个图书馆,那么DRAM就像读者手中的书,NAND就像书架上的书,而存储级内存就像是放在阅读桌上的书。
它比书架上的书更容易拿到(速度快),但又不会一直占用读者的手(成本低于DRAM)。读者可以快速从桌上拿到想看的书,而不必每次都去书架找。
具体到技术层面,存储级内存试图填补DRAM和NAND之间的性能与成本空白-9。它的密度比DRAM高,成本比DRAM低,同时访问速度比NAND快得多-2。
在人工智能和大数据时代,这种中间层次的存储变得越来越重要。比如,当智能助手需要快速访问大量用户数据来提供个性化服务时,存储级内存就能发挥它的优势——提供比传统存储更快的访问速度,同时保持合理的成本。