哎呦喂,您有没有遇到过这样的憋屈时刻?正打游戏呢,眼看要放大招,画面突然卡住转圈圈;或者处理一个大表格,点一下保存,电脑就跟“思考人生”似的,半天没反应。这背后的“罪魁祸首”,多半是那个默默干活但又常常力不从心的仓库管理员——存储设备。今天,咱就来唠唠存储江湖里的几位“侠客”:老当益壮的NAND Flash、中流砥柱的3D NAND,还有那位曾号称要颠覆江湖却命运多舛的3D XPoint,看看它们到底有啥本事,又为啥没能一统天下-1。

咱电脑手机里的数据,归根到底就是一串0和1。存储器的核心任务,就是把这串数字安安稳稳地“放”好,并且能快速“拿”出来。传统的NAND Flash(闪存)就像个大仓库,用“浮动栅”晶体管来存电荷(代表1)或不存电荷(代表0)-8。但这仓库是平房,想多存货,就得把每个房间(存储单元)做得特别小。这就到了物理极限,房间太小,隔壁间的干扰就特别严重,数据容易出错,寿命也蹭蹭往下掉-3-4。
咋办呢?工程师们一拍脑袋:平面不够,咱往立体发展啊!于是,3D NAND技术应运而生。它不追求在平面上雕花,而是像盖摩天大楼一样,把存储单元一层层堆叠起来-3-4。这一下,存储密度实现了革命性提升。像长江存储开发的“晶栈”(Xtacking)架构,更是创新地把存储单元阵列和外围电路分别在两片晶圆上制造,然后像搭乐高一样垂直整合,不仅性能更高,生产周期也缩短了-3-4。可以说,3D NAND靠着“叠楼”的本事,成功接过了NAND Flash容量扩张的大旗,成了现在固态硬盘(SSD)的绝对主力。

虽然3D NAND解决了容量问题,但它的一个“老毛病”还在:它是“块寻址”的。你想改仓库里某个小箱子里的一个苹果,对不起,你得把整个货架(数据块)都搬出来,改好再整个搬回去,效率低下-1-8。而内存(DRAM)是“字节寻址”的,可以直接定位到那个苹果,所以速度极快,但一断电,数据就全没了-1。
于是,一个完美的梦想出现了:有没有一种技术,既能像内存一样快速、精确地访问每一个字节,又能像闪存一样断电后数据不丢失呢?这个梦想,就是“存储级内存”。而3D XPoint,正是英特尔和美光在2015年抛出的、最接近这个梦想的答案-1-5。
这家伙确实有两把刷子:
原理革新:它完全抛弃了晶体管,利用一种特殊的硫族化物材料,通过电压改变其电阻状态(高阻代表0,低阻代表1)来存储数据-2-8。
结构独特:采用三维交叉点阵列结构,字线和位线垂直交错,在每个交叉点上都有一个存储单元和一个选择器,实现了对每个比特的独立寻址-5-8。
性能怪兽:官方宣称其速度比NAND Flash快1000倍,耐用性高1000倍,密度是传统内存的10倍-7-9。它的定位,就是填补DRAM和NAND Flash之间巨大的性能鸿沟-1-6。
英特尔给它起了个霸气的名字“傲腾”(Optane),应用于内存和SSD产品-5。一时间,江湖震动,大家都以为革命来了。
这位“天降猛男”的江湖路却走得异常坎坷,最终在2022年黯然退场-2。为啥呢?说白了,理想和现实之间,隔着成本、功耗和生态三座大山。
成本居高不下:虽然理论上晶圆面积成本与NAND接近,但复杂的材料和工艺导致其总体成本远高于NAND,大约是后者的4到5倍-5-6。对于绝大多数消费级应用来说,用这么贵的部件去获得那部分感知不强的极致性能,实在不划算。
功耗与可靠性挑战:3D XPoint核心的相变材料(PCM)在切换状态时需要较高的电流,带来功耗和散热压力-2。同时,其选择和存储单元串联的架构,在追求更高堆叠层数时变得非常复杂且昂贵,限制了其密度和成本的进一步优化-2。
生态位尴尬:它比DRAM慢,但比NAND贵得多-10。在服务器市场,它曾想通过CXL(计算快速链路)技术以内存扩展器的身份在DRAM侧立足,但对耐久性、功耗的要求极为严苛-2。在消费市场,普通用户和游戏玩家对“内存硬盘鸿沟”的痛感,并没有强烈到愿意支付高昂溢价。
所以,3D XPoint的悲剧在于,它作为一个技术上的“工艺品”非常杰出,但作为一个市场化的“商品”,却没能找到足够大、且愿意买单的应用场景。它的故事告诉我们,在存储江湖里,平衡性能、成本和需求,比单纯追求技术参数更重要。
3D XPoint退场了,但填补“内存硬盘鸿沟”的梦想并未熄灭。江湖中,新的挑战者已经出现。
其中一个是 “纯OTS存储器” 。研究人员意外发现,用于3D XPoint中的Ovonic阈值开关(OTS)选择器本身,在特定条件下就能表现出记忆特性-2。这意味着,未来可能用一个元件同时完成选择和存储的功能,材料系统更简单,制造更容易,尤其是能耗有望降低到PCM的十分之一,非常适合未来CXL内存的应用需求-2。
另一个方向是 “存算一体” 。这思路更绝,干脆不让数据在处理器和存储器之间“跑来跑去”了,直接在存储单元里完成计算,彻底打破“存储墙”-4。这被认为是应对人工智能等数据密集型任务的关键方向。
总而言之,存储技术的进化,是一部围绕速度、容量、成本、耐用性和功耗的永恒“平衡术”。从NAND Flash到3D NAND,是容量维度的胜利;而3D XPoint的探索,则是在速度与持久性维度上一次悲壮的前冲。未来,无论是纯OTS存储器还是存算一体,它们都将继续在这条平衡木上寻找新的支点。对于我们用户而言,好消息是,这场没有硝烟的江湖之争,最终总会让更快、更大、更稳、更便宜的存储设备,飞入寻常百姓家。
1. 网友“科技老饕”提问:看了文章,还是有点抽象。能不能举个更形象的例子,说明“块寻址”(NAND)和“字节寻址”(3D XPoint/内存)在实际使用中到底有啥区别?
答:这位朋友问得好,咱就用一个贴切的比喻来说道说道。想象一下,你有一个超大的图书馆(存储空间)。
“块寻址”的NAND Flash:这个图书馆的管理员有点“懒”,或者说是规矩如此。你想去修改某一本书(一个数据位)里的一个错别字。管理员不会直接带你去找到那本书、那一页。他会说:“对不起,先生/女士,我们的最小服务单位是‘一个书架’(一个数据块,通常大小如4KB)。您告诉我这本书在哪个书架,我得把整个书架的书都搬出来,送到您面前的阅览桌上。您改好那个错别字后,我再把这个书架上所有的书(包括其他你没动过的)重新检查一遍,然后整个书架原封不动地搬回去放好。” 这个过程,就是NAND的“读取-擦除-写入”周期-8。即使你只改1个字节,也得搬动整个块(几千个字节),自然就慢、也损耗书架(影响寿命)。
“字节寻址”的3D XPoint或DRAM(内存):这个图书馆的管理员就非常高效精准。你想改哪个错别字,他直接带你到对应的区域、书架、层、那一本书、那一页、那一行。你当场提笔就改,改完合上书放回原处,完事。整个过程只涉及你真正要动的那一丁点地方,速度快得飞起。
所以,当你频繁保存、编辑大文件(如视频工程、大型设计图),或者数据库在处理大量随机小数据更新时,“字节寻址”的优势就是碾压性的。而3D XPoint当年想做的,就是成为一个既能像第二个管理员那样精准服务(字节寻址、速度快),又能在图书馆下班断电后(电脑关机),所有书本位置和信息都保持不变(非易失性)的“超级管理员”-1-6。遗憾的是,雇这位“超级管理员”的薪水(成本)太高了,大多数图书馆(普通用户)用不起。
2. 网友“攒机小白”提问:原来傲腾(Optane)这么厉害又这么惨啊。那我现在买电脑,特别是装机和升级SSD的时候,到底该怎么在SATA、NVMe这些里面选?它们和今天讲的这些技术是啥关系?
答:这个问题非常实际!别被吓到,其实你提到的这些(SATA、NVMe)和今天讲的(NAND、3D XPoint)属于不同层面的概念,我帮你理一下:
存储介质(是什么): 这是“仓库本身用什么材料和方法盖的”。比如今天文章的主角:3D NAND是当前绝对主流的“盖楼”方式,决定了SSD的容量和基本体质。而3D XPoint是另一种更高级但已退市的“建筑工艺”。
接口协议(怎么运货): 这是“仓库门口连接外界的马路和交通规则”。SATA就像一条老旧的县道,速度上限低(约600MB/s)。NVMe则是一条基于PCIe车道的高速公路,红绿灯少(协议效率高),速度上限极高(可达每秒数GB甚至更高),能充分发挥高性能“仓库”(如优质3D NAND SSD)的出货能力。
给你的直接建议是:
看接口:现在装机或升级,无脑选NVMe协议的M.2接口SSD。它速度远快于SATA,已是主流和性价比之选。
看介质:在NVMe SSD里,关注其是否采用3D NAND以及堆叠层数(如176层、232层)。通常层数越高,技术越新,容量密度和性能可能越好。品牌方都会把这作为宣传点。
看缓存:有些高端SSD会搭配一小块DRAM缓存(独立缓存)来提升性能,对于频繁读写有帮助。没有独立缓存的盘会调用一部分主机内存或使用SLC缓存策略,日常用也够。
忘掉傲腾:对于普通游戏、办公、娱乐用户,3D XPoint(傲腾)已成过去式,不需要也不应该纳入考虑。它的性能优势在绝大多数日常场景中感知不强,且已退市无后续。
简单说,你现在要关心的就是:选一条NVMe高速路(接口),连接一个用现代高层建筑工艺(3D NAND)盖的大容量、有口碑的仓库(品牌SSD),就能获得非常棒的体验了。
3. 网友“未来观察家”提问:文章最后提到“纯OTS存储器”和“存算一体”,感觉很有未来感。它们离我们实际用到还有多远?另外,我们国家的长江存储的“晶栈”技术,在国际上到底是个什么水平?
答:这两个问题一个关乎未来,一个关乎当下,问得很有水平。
关于“纯OTS存储器”和“存算一体”的距离:
纯OTS存储器:目前仍处于高级研发和原型验证阶段。像imec这样的顶级研究机构已经在300毫米晶圆上制造出了原型器件,展示了超低功耗和足够快的操作速度等优势-2。但它走向商业化还需解决材料环保性(替换掉砷、硒等元素)、将耐久性再提升数个数量级、以及降低单元之间的性能波动等关键挑战-2。乐观估计,其作为CXL内存等专业应用登场,可能还需要好几年时间。
存算一体:这是学术界和产业界共同的热点,但路径多样。一些基于新型存储器(如阻变器件RRAM)的存算一体芯片,已在实验室针对AI推理等特定任务展示了惊人能效-4。但要作为一种通用计算架构取代或部分取代现有CPU/GPU+内存的模式,道阻且长。它面临电路设计复杂度高、精度控制难、编程模型和软件生态从零构建等巨大挑战。短期内,我们更可能先在智能手机、物联网设备的AI协处理器等特定场景中见到它的身影-4。
关于长江存储“晶栈”(Xtacking)技术的水平:
可以毫不夸张地说,“晶栈”是近年来NAND闪存领域最具颠覆性的架构创新之一,让长江存储实现了从追赶到并跑,甚至在某些方面引领的跨越-3-4。