价格倒挂的DDR4市场与AI算力需求形成鲜明对比,企业服务器机房里的硬件升级压力正在成为技术主管们夜不能寐的新烦恼。
一家中型电商公司的技术总监最近发现,公司数据中心里那些基于上一代CPU平台的服务器,内存升级成本莫名其妙涨了三倍多。与此同时,新采购的支持DDR5的服务器在AI推理任务上表现出的性能优势,让他开始认真考虑全面升级的可行性。

这正是当前内存市场供需扭曲和技术换代交织的缩影:更先进的DDR5正在成为AI和高性能计算的主流选择,而技术相对落后的DDR4却因供应减少价格飙升-3。
存储芯片市场正在上演一场罕见的价格戏码。DDR4 32GB RDIMM的价格已经突破290美元,较年初飙升超过300%-3。
而技术更先进的同容量DDR5内存,价格涨幅却不到前者的一半。这种价格背离源于供需的深层矛盾。
许多国内数据中心仍大量使用支持DDR4的上一代CPU平台,而全球主要DRAM厂商已相继宣布对DDR4实施停产计划-3。
上游芯片厂商的库存已降至罕见低位,消费级内存的产能被严重挤压。大型电子公司为确保供应,纷纷与巨头签订长期供应协议,导致普通消费端能获得的份额更加稀缺-3。
与此同时,英特尔、AMD的新一代平台已全面转向DDR5,三星、美光等存储巨头也基本停止了DDR4的新品开发-3。
“DDR5的导入需要CPU、主板、固件的全栈支持,这恰恰是国内产业的薄弱环节。”一位行业从业人员坦言-3。
在AI推理场景下,使用DDR4的平台在处理并发请求时延迟明显偏高,如果不能在短期内完成DDR5的切换,在服务响应速度上将丧失竞争力-3。
英特尔在内存领域的技术布局远比表面看起来更加多元和深入。这家芯片巨头正在通过多种技术路径,应对不同场景下的内存挑战。
英特尔® 傲腾™ 持久内存(PMem)采用创新内存技术,将高性价比的大容量内存与对数据持久性的支持结合。
第三代英特尔® 至强® 可扩展处理器和英特尔® 傲腾™ 持久内存200系列通过创建两层内存和存储分层架构,优化工作负载的性能与成本-1。
与上一代产品相比,200系列将内存带宽平均提高多达32%。该系列有128 GB、256 GB和512 GB模组可供选择,提供大容量和持久性-1。
英特尔还展示了MRDIMM这种新型DIMM内存技术,与第五代英特尔至强处理器相比,该技术可为HPC工作负载提供高达2.3倍的性能提升,为AI推理工作负载提供高达2倍的性能提升-10。
MRDIMM在外形尺寸上与当今的DDR5 RDIMM兼容,用户无需重新设计系统板或牺牲任何DDR5可靠性、可用性和可维护性(RAS)功能,也无需对软件进行任何更改-10。
有趣的是,英特尔还探索了将内存与CPU封装在一起的方案。Lunar Lake架构处理器曾在CPU内封装了两颗LPDDR5X内存,实现了CPU访问内存的通信延迟降低30%、整体功耗优化15%、PCB面积减少25%-5。
不过,这一方案因成本和生产复杂性而被调整为“一次性”方案,后续产品将回归传统内存接口-5-8。
英特尔为不同使用场景提供了多种工作模式,让企业可以根据自身需求选择最合适的内存解决方案。
英特尔® 傲腾™ 持久内存200系列具有两种主要工作模式:内存模式和App Direct模式。
内存模式无需更改应用即可提供大内存容量,并且性能接近DRAM,具体视工作负载而定-1。在内存模式下,CPU内存控制器将所有英特尔® 傲腾™ 持久内存200系列视为易失性系统内存,CPU将DRAM用作英特尔® 傲腾™ 持久内存的高速缓存-1。
与DDR4 DRAM相比,内存模式下持久内存的大内存容量能够以更低的成本支持更多虚拟机,并为每个虚拟机分配更多内存。I/O依赖型工作负载也可以从内存模式中受益-1。
App Direct模式能够实现大内存容量和数据持久性,软件可以将DRAM和持久内存作为两个独立的内存池进行访问-1。
在App Direct模式下,支持行业标准持久内存编程模型的软件和应用能够直接与持久内存通信,直接访问降低了堆栈的复杂性并能充分利用具备缓存一致性和字节可寻址特点的持久内存-1。
对于不同的应用场景,英特尔还提供了CXL技术作为补充方案。CXL基于PCIe协议构建,最大优势不在于极致的带宽和性能,而是为数据中心提供了兼具灵活性和高性价比的解决方案,可以连接相对廉价的内存-4。
在实际客户处的测试中,CXL 2.0在某些经过优化的场景下甚至能达到90%-95%的性能指标-4。
随着AI和高性能计算需求的爆炸性增长,内存技术已成为这些领域的核心战场。不同技术方案正在针对特定场景展开竞争。
根据集邦咨询发布的2025年第一季度数据,在全球服务器DRAM市场中,DDR5产品出货量占比已超过90%,成为AI训练、云计算等高算力应用场景中的主流选择-3。
AI成为全球DDR5普及的核心引擎-3。在5G通信、生成式AI等高算力应用场景中,包括基站、边缘计算节点及数据中心算力基础设施,如果不能及时升级至DDR5内存,将难以满足低延迟、高并发的数据处理需求-3。
同样,在金融服务领域,如果核心系统仍固守DDR4架构,未来在处理高频交易、实时风险控制等任务时,将面临显著的数据传输瓶颈-3。
英特尔与软银合作研发新型AI内存芯片,计划设计一种新型堆叠式DRAM芯片,采用不同于现有高带宽内存的布线方式,预期将电力消耗减少约一半-2。
这一创新设计将有效提升芯片的能效比,对于降低AI数据中心的运营成本以及推动绿色计算具有重要意义-2。
在高性能计算领域,英特尔MRDIMM技术表现出色。在德国汉堡举行的2024年国际超级计算大会上,英特尔发布的早期性能结果显示,与上一代系统相比,MRDIMM配置系统可为NEMO等实际HPC应用程序提供高达2.3倍的性能提升-10。
随着企业对高性能计算和AI应用需求的不断增长,内存技术的发展将更加注重性能、能效和可扩展性的平衡。
英特尔正在推动多种内存技术路线并行发展。MRDIMM技术后续将朝着更高带宽、更低延迟、更大容量的方向发展;CXL技术则致力于构建灵活的内存池化方案;而傲腾持久内存继续填补DRAM与存储之间的空白-4。
这些技术仍需要经过市场的进一步验证和成熟度的提升。为了充分发挥其优势,英特尔等公司计划加大研发投入,推动技术创新和生态合作,共同构建一个更加完善、高效的数据中心生态系统-4。
随着核数增多、处理能力和主频的提升,相应要打破“内存墙”、突破内存的容量和性能问题,也分别会有不同技术来满足未来数据中心建设的需求-4。
行业需要承受包括技术适配成本、供应链重构压力以及市场供需波动在内的阶段性阵痛,这些都是技术升级必须付出的代价-3。
在技术转换的关键窗口期,存储芯片、CPU、软件厂商等产业链各环节的深度协作显得尤为重要-3。
在北京中关村的一家数据中心里,服务器指示灯有规律地闪烁着。技术团队刚刚完成了一部分服务器的内存升级,从DDR4切换到了DDR5平台。
当他们重新启动AI推理服务时,响应时间的曲线明显变得更加平稳。
在全球服务器DRAM市场中,DDR5产品出货量占比已超过90%,这一数字背后是无数个类似的升级决策-3。