手机电量显示再次变红,你看着充电宝叹了口气,与此同时,某个AI数据中心正为电费账单发愁,这些问题背后,有一个共同的“吃电大户”——DRAM内存。

刚过去的周末,笔者新买的手机又一次在下午就告急电量,不得不翻出充电宝。与此同时,朋友抱怨公司的AI服务器机房电费单越来越厚。这两件事看似不相干,但其实背后都有一个共同的“耗电大户”——DRAM内存。

无论是我们口袋里的智能手机,还是庞大的数据中心服务器,动态随机存取存储器都消耗着惊人的能量。在服务器级系统中,DRAM设备消耗高达40%的功率,而在显卡中,这一数字甚至能达到50%-1


01 节能潜力

DRAM节能这事,说来简单做起来难。一个主要的障碍是,传统上DRAM功率管理往往集中在“rank”层级(由多个芯片组成的逻辑单元),而对更细粒度的“bank”级(单个芯片内部的分区)管理关注不足-1

这就好比整栋楼统一开关灯,而不是根据房间实际使用情况控制照明。结果是大量未被充分利用的DRAM组件仍在消耗能源。

你可能不知道,随着芯片尺寸不断缩小,制造过程中的微小差异会导致部分DRAM单元性能下降,这些问题单元不仅速度慢,能耗也高于正常单元。研究人员发现,如果能识别并专门管理这些“问题区域”,就能实现显著的节能效果-1

VAR-DRAM框架就是基于这一洞察开发的,它通过检测性能较差的DRAM单元,并将它们的数据重新映射到正常单元,同时将这些性能不佳的单元置于超低功耗状态。结果显示,这种方法在DDR4内存上能实现高达48.8%的峰值节能,平均节能也达到29.54%-1

02 智能调度

更智能的调度方法可以带来意想不到的节能效果。研究表明,通过对内存请求进行更精细的管理——比如根据请求类型(读或写)进行智能分组——能够显著降低DRAM的功耗-7

一种新的调度技术通过列间读写感知集群方法和列内读写感知重新排序方法,平均有效降低了75%的DRAM功耗。与现有策略相比,新技术在相当或更少的性能下降情况下,还能进一步降低10%的功耗-7

这种方法的巧妙之处在于,它不仅考虑了请求的目标地址,还充分考虑了请求类型的特性,从而做出更优的电源管理决策。这就像是一位经验丰富的交通指挥员,不仅考虑车辆要去哪里,还考虑车辆类型,从而更有效地管理交通流量。

03 电压与能效平衡

降低工作电压是减少电子设备能耗的经典方法,DRAM也不例外。研究团队在124个实际DDR3L DRAM芯片上的实验发现了一个有趣的平衡点。

当电压降低到特定水平以下时,会出现数据错误;但通过适当增加DRAM操作的延迟,可以避免这些错误-5

基于这一发现,Voltron机制被开发出来。它利用性能模型确定在不超过用户指定的性能损失阈值的情况下,能将电压降低多少-5

评估显示,Voltron平均降低DRAM能耗10.5%,系统总能耗降低7.3%,而平均系统性能损失仅为1.8%-5。这种精细的电压调控策略,在节能和性能之间找到了最佳平衡点。

04 架构创新

产业界正在开发全新的DRAM架构以实现更大突破。软银与英特尔合作研发的新型堆叠式DRAM芯片采用独特的布线方式,预计将电力消耗减少约一半,这对于降低AI数据中心的运营成本具有重大意义-2

铠侠公司则展示了高度可堆叠的氧化物-半导体沟道晶体管技术,能够实现OCTRAM的3D堆叠-3。由于氧化物半导体具有低关断电流特性,预计可以显著降低刷新功耗-3

与此同时,新型内存技术如TDIMM通过优化接口设计,使用更新的DRAM组件,能在不增加功耗的前提下大幅提升带宽-10

05 应用优化策略

在特定应用场景中,专门优化可以带来惊人的节能效果。例如在视频处理领域,外部DRAM消耗超过整个系统一半的功率-9

研究人员开发了一种无损压缩算法,通过像素级方向预测和动态熵编码,将外部参考帧的平均数据流量减少了68.5%,从而使DRAM的动态功耗降低了42.3%-9

结合基于分区的存储空间减少方案,又额外节省了14.5%的DRAM动态功耗-9。这些优化总共使外部参考帧访问的动态功耗需求降低了56.8%-9

对于图像处理,一种选择性位丢弃和编码策略通过减少原始像素数据中“1”位的数量,实现了DRAM功耗降低39.8%的效果-8


手机内存芯片堆叠技术已经能够实现8层晶体管堆叠结构并正常运行-3。而视频处理中无损压缩算法通过智能数据管理,将DRAM的动态功耗需求降低了惊人的56.8%-9

无论是手机一天三充的烦恼,还是数据中心巨额的电费账单,DRAM节能技术正在从实验室走向现实,这些创新将让我们的数字世界在性能提升的同时,变得更加绿色可持续。

DRAM节能的探索并未停止,软银与英特尔正在开发的全新堆叠式DRAM芯片,有望将电力消耗减少约一半-2,这可能彻底改变未来AI数据中心的能源格局。

网友问答

@数码达人小明: 这些DRAM节能技术听起来很厉害,但它们真的能应用到我们日常用的手机上吗?具体能延长多少续航时间?

这个担忧很实际。很多前沿技术确实存在“从实验室到市场”的鸿沟,但DRAM节能技术不同,它已经在路上了。软银与英特尔合作开发的新型DRAM芯片就是明确面向实际应用的-2

手机续航是个系统工程,DRAM节能是其中重要一环。考虑到DRAM在移动设备中的功耗占比,哪怕10%-20%的DRAM能耗降低,转化为整机续航提升也相当可观

特别是VAR-DRAM这样的技术,通过识别并管理性能不佳的存储单元,在DDR4内存上能实现平均29.54%的节能-1。如果应用于手机,这直接意味着更长的使用时间或更轻薄的电池设计。

@技术极客老王: 我是做AI模型训练的,公司数据中心的电费账单越来越吓人。这些新的DRAM技术能帮我们省多少钱?实施起来复杂吗?

您的痛点正是行业焦点。在AI数据中心,DRAM能耗占比极高。传统DRAM技术已接近物理极限,但新一代技术如铠侠的3D DRAM采用氧化物半导体,关断电流极低,可显著降低刷新功耗-3

RED框架专为AI场景优化,通过可重构电压摆幅和刷新感知调度,能将eDRAM宏的能耗降低高达74.88%-6。Tachyum的TDIMM技术则通过设计优化,使用更新的DRAM组件控制功耗-10

实施方面,像TDIMM已经设计为与标准DDR5 DIMM物理尺寸兼容,主要需要更改塑胶模具即可生产-10。软银与英特尔的合作项目计划在两年内完成原型-2,产业节奏正在加快。

@硬件爱好者小李: 我注意到有些技术是通过降低电压来节能的,这样会不会影响内存的稳定性和寿命?玩游戏或者跑大型软件时会不会出现蓝屏?

这个问题切中了关键平衡点。确实,电压降低可能引入数据错误,但Voltron等技术的巧妙之处在于找到了安全边界-5。它们不是简单地降电压,而是建立精细的性能模型,在保持系统稳定的前提下智能调节

Voltron机制通过实验确定,在适当增加DRAM操作延迟的情况下,可以安全降低电压而不引入错误-5。评估显示,它能平均降低DRAM能耗10.5%,而平均系统性能损失仅为1.8%-5

对于游戏等场景,VAR-DRAM框架通过将数据从性能受影响的单元重新映射到正常单元,实际上改善了访问延迟7.4%-1。所以,好的DRAM节能技术不是以牺牲稳定性和性能为代价,而是通过智能管理实现多方共赢。