老张盯着电脑屏幕上又一次因内存不足而卡死的AI模型训练界面,忍不住拍了下桌子,旁边工程师小声嘀咕:“这已经是今天第五次了,数据搬到内存的速度,根本追不上GPU计算的速度啊。”

没人想到,在AI算力竞赛中最先撞上的不是算力天花板,而是记忆高墙

半导体行业的数据显示,过去20年间,硬件峰值浮点运算性能增长60000倍,而DRAM带宽仅增长100倍,这种失衡直接导致超过90%的AI加速器能耗用于搬运数据而非计算-1


01 记忆之墙

存储与计算的速度差距正在不断扩大,这就是业内常说的“存储墙”问题。AI模型参数已经从百万级跃升至万亿级,但内存技术的进步远远跟不上算力需求的爆炸式增长-1

Roofline模型清晰地揭示了这一矛盾:任何计算系统的最终性能,都由其峰值算力和内存带宽共同决定。

举例来说,英伟达H100 GPU的BF16精度下峰值计算性能达989 TFLOPs,但峰值带宽仅3.35TB/s-1。这种不匹配导致了计算资源大量闲置,AI芯片的潜力根本无法完全释放。

“你说这事儿急不急人,处理器跑得飞快,可数据跟蜗牛一样慢吞吞地从内存里挪出来,这不等于让博尔特在泥地里跑步嘛!”

存储墙已经成为制约AI发展的核心瓶颈,而破墙的关键,可能藏在两类看似不那么主流的存储技术中。

02 利基DRAM:小众市场的大机会

很多人可能没听说过利基DRAM,但在专业圈子里,这种产品已经默默撑起了一个近百亿美元的市场。2024年,全球利基DRAM市场规模达到85.1亿美元-2

与追求极致性能的主流DRAM不同,利基DRAM更专注于特定应用场景的需求平衡。这类产品通常包括LPDDR2/3、DDR2/3以及容量在8Gb及以下的DDR4/LPDDR4-2

它们瞄准的是消费及网通产品、智能家居、汽车电子及工业控制等利基市场。一位行业分析师打了个比方:“这就像汽车市场,既有追求速度的超跑,也有皮实耐用的工具车,各有各的生存空间。”

这些领域对存储器有着特殊要求:更长的生命周期、更高的可靠性和更强的环境适应性。而利基DRAM正是在这些方面找到了自己的立足点。

03 SRAM的性能革命

如果说利基DRAM是工具车,那么SRAM就是内存世界的超跑。SRAM凭借低延迟、高带宽、低功耗、高可靠性的优势,成为处理器缓存等关键部位的首选-6

但SRAM也有自己的烦恼:高成本和低密度。相较于DRAM,SRAM单位容量成本更高,这限制了其在大容量存储中的应用-6

AI时代的到来为SRAM打开了新天地。越来越多的AI推理芯片与存算一体架构芯片开始用SRAM替代部分DRAM,以获得更快的存取速度和更低的刷新延迟-7

Groq公司开发的LPU(语言处理器)是个典型案例,其单颗芯片集成了高达230MB的SRAM,内建内存频宽上看80TB/s-7。这种设计成功避开了传统DRAM与外部内存的带宽瓶颈。

04 两条不同的破墙之路

面对存储墙,利基DRAM和SRAM选择了不同的突围路径。

利基DRAM的路线是坚守特定市场,向更大容量演进。它们不追求最先进的制程,而是通过成熟稳定的工艺,在车规、工控等领域建立起护城河。随着汽车智能化的发展,车规级利基DRAM需求正快速增长-2

而SRAM则走技术创新和架构融合的路线。除了通过工艺迭代优化性能外,SRAM还通过3D堆叠技术突破面积限制。

AMD的Ryzen 7 5800X3D处理器采用3D堆叠V-Cache技术,将L3缓存容量提升至96MB,游戏性能显著提升-1

更重要的是,SRAM正在成为存算一体架构的核心组件。联发科天玑9500芯片的NPU就采用了存算一体架构,实现了AI模型常驻运行的“Always-On”体验-7

05 黄金交叉点

当前,AI计算正从云端向边缘扩展,这为利基DRAM和SRAM创造了前所未有的机遇。

一方面,边缘AI设备对低功耗和高可靠性的要求,与利基DRAM的产品特性高度契合;另一方面,边缘AI的实时性需求,则需要SRAM提供的高速缓存能力-7

特别值得注意的是,AI终端设备的普及正在催升专用存储容量需求-2。无论是智能手机、可穿戴设备还是智能家居产品,都需要更大容量、更快速、更可靠的芯片来支撑AI功能。

这种需求增长已经开始在市场中体现。2024年全球专用型存储市场规模已达135.9亿美元,预计到2029年将增长至208.2亿美元-2。其中利基DRAM预计将从85.1亿美元增至132.1亿美元。

06 产业变局中的中国角色

在存储芯片这个高度集中的市场中,中国厂商正在利基领域寻找突破口。2024年,兆易创新在全球利基DRAM市场位列第七,也是排名第二的中国内地企业-2

与海外大厂聚焦高世代大宗存储产品不同,国内厂商正凭借专用存储领域的技术积累,拥抱AI时代下端侧设备带来的海量存储需求-2

这一战略选择有其合理性:专用存储市场正逐步脱离大宗存储的强周期性,提供了更稳定的发展环境-2

同时,中国拥有全球最大的AI应用市场,从智能汽车到物联网设备,丰富的应用场景为存储芯片创新提供了试验田。


存储芯片的竞争格局正在悄然变化,当三星、SK海力士和美光在高带宽存储器上激烈争夺时,联发科在天玑9500芯片中已经用存算一体架构的SRAM实现了AI模型常驻运行-7

兆易创新等中国企业在利基DRAM市场上的份额虽小却在稳步上升-2。未来真正的较量,可能不再是单纯的技术参数竞赛,而是看谁能更好地理解并解决“AI需要怎样的记忆”这一根本问题。