看到数据中心电费账单时,技术主管老王眉头紧锁,直到他发现通过调整内存的电源管理策略,整个机房的能耗竟然能降低超过三分之一。

“俺们做技术的都知道,现在搞系统优化,省电就是省钱。”一位在数据中心工作了十年的工程师感慨道。随着DDR4逐渐退出历史舞台,DDR5和HBM成为主流,内存的能耗问题愈发凸显-3

但内存节能不是简单粗暴地关掉电源,里面的门道可多了。


01 操作系统来帮忙,GreenDIMM让节能更智能

GreenDIMM这个名字听起来就挺环保的,它是一种由操作系统辅助的DRAM电源管理方案。传统的内存节能措施往往以内存秩(rank)为最小单位,这在实际应用中效果有限-2

现在的数据中心服务器内存容量利用率通常只有40%-60%,但为了保持性能,大部分内存模块不得不保持全功率运行-7

GreenDIMM的聪明之处在于,它将内存块作为电源管理的基本单元。这些内存块跨越每个通道、每个秩和每个存储体,同时保持了内存交错技术的优势-7

通过操作系统动态地将内存块从物理地址空间中移除或添加,那些被“下线”的内存块就可以进入深度的DRAM power down状态。评估显示,这种方法能够降低约36%的DRAM功耗和20%的系统功耗,而性能损失仅为1%左右-7

02 实时系统怎么办?运行时策略显身手

对于实时系统来说,节能可不是随便就能做的。你总不能为了省电让视频流卡顿或者让自动驾驶系统延迟响应吧?这就需要更精细的DRAM power down策略-1

研究人员提出了两种针对实时内存控制器的运行时节能策略。第一种策略能够在保证带宽和延迟界限不受影响的情况下实现显著的节能效果-1

第二种策略则提供了更高的节能效果,但延迟界限略有增加,不过仍然保持了实时内存控制器所提供的带宽保证-1

这两种策略在实时MPSoC平台上并发运行四个媒体应用时,分别实现了42.1%和51.3%的内存节能效果-1

03 嵌入式场景特殊,延长数据保留是关键

在嵌入式系统中,情况又不一样了。这些设备往往对功耗极其敏感,但又不能丢失数据。于是,一种扩展数据保留(EDR)睡眠模式被提了出来-5

这种技术通过ECC和MT-CMOS的结合,在睡眠模式下将数据保留时间提高了8倍,同时将漏电流降低到正常工作模式的13%-5

更妙的是,ECC清理操作只在EDR睡眠模式下进行,所以不会降低正常的读写性能-5。采用65纳米工艺制造的低功耗嵌入式DRAM宏,能够实现400MHz的操作频率,而数据保留功耗仅为0.39mW-5

04 唤醒速度可调节,按需选择真灵活

你有没有想过,不同的应用场景对内存唤醒速度的需求是不同的?移动设备可能更注重节能,而高性能计算设备则追求快速响应。

三星的一项专利技术解决了这个问题,它允许在退出DRAM power down模式时选择不同的唤醒速度-6

这种技术将power down退出信息存储在模式寄存器中,系统可以根据需要选择快速唤醒或慢速唤醒模式-6

如果需要节能优先,比如在移动产品中,可以选择唤醒较慢但更省电的模式;如果是在高性能计算设备中,则可以选择快速唤醒模式-6

05 模拟工具不可少,gem5集成助力研究

研究这些节能技术需要合适的工具。2018年,研究人员将DRAM power down模式集成到了开源的gem5模拟器中-9

这是首个公开可用的支持DRAM power down模式的完整系统模拟器,为研究社区提供了一个分析各种用例下DRAM功耗的工具-9

通过使用真实的高性能计算工作负载进行评估,这个模型显示了将低功耗功能集成到完整系统模拟器中的价值-9


当四大DRAM原厂齐声宣布DDR4停产计划时,整个行业的目光都投向了更先进的DDR5和HBM-3。价格倒挂现象已经出现,DDR4 16Gb 3200现货价甚至一度比DDR5同容量产品高出30.3%-3

在这个技术转型的关键时期,DRAM power down技术显得尤为重要。从操作系统辅助的智能管理,到实时系统的精细控制,再到嵌入式设备的特殊优化,每一处节能都可能在不经意间为整个行业带来变革。技术前进的路上,省下的每一瓦电,都在为更可持续的数字未来铺路。

网友问答环节

网友“芯片小匠”提问: 我们公司正在设计下一代物联网设备,对功耗要求极高。看了文章提到的嵌入式DRAM扩展数据保留睡眠模式很感兴趣,但担心这种技术是否成熟可靠?在实际产品中应用会不会有风险?

回答: 你这个问题问得非常实际,做产品确实不能只盯着纸面上的数据。从技术成熟度来看,这种扩展数据保留(EDR)睡眠模式已经通过了实际验证。研究显示,采用65纳米工艺制造的低功耗嵌入式DRAM宏,能够实现400MHz操作频率和仅0.39mW的数据保留功耗-5

关键在于这种技术如何平衡节能与可靠性。EDR模式通过结合ECC(错误校正码)和MT-CMOS技术,在睡眠模式下将数据保留时间提高了8倍,同时将漏电流降低到正常工作模式的13%-5。更值得关注的是,ECC清理操作只在EDR睡眠模式下进行,这意味着它不会影响正常读写性能-5

在实际应用中,建议你可以先从非关键任务模块开始试用,比如设备中不那么紧急的数据缓存部分。同时,要确保你的电源管理单元能够与这种睡眠模式良好配合,避免状态切换时出现电压不稳的情况。现在很多芯片厂商都提供了参考设计和应用笔记,可以帮助你们更快地上手。

网友“数据中心运维”提问: 我在大型互联网公司负责数据中心节能优化,最近正在研究内存功耗问题。文章提到GreenDIMM可以降低36%的DRAM功耗,这个数字很吸引人。但我们的服务器跑的都是关键业务,能否详细介绍下它是如何做到只损失1%性能的?

回答: 老哥你这问题问到点子上了,性能损失确实是企业最关心的。GreenDIMM能做到这么小的性能损失,主要靠的是它精细化的管理粒度。传统DRAM节能措施以内存秩为单位,而GreenDIMM则以内存块为基本单元,这些内存块跨越每个通道、每个秩和每个存储体-7

它的聪明之处在于利用了操作系统内存在线/离线操作。系统会根据运行时内存容量的利用率,动态地将内存块从物理地址空间中移除或添加-7。那些被“下线”的内存块进入深度power down状态,而活跃的内存块则保持全速运行。

实际测试中,GreenDIMM在运行各种工作负载的商业服务器上,确实实现了约36%的DRAM功耗降低和20%的系统功耗降低,性能损失仅为1%左右-7。你可以先从非高峰时段或测试集群开始尝试,监控实际影响后再逐步推广。

网友“硬件发烧友”提问: 我是一名计算机专业的学生,最近在做关于内存功耗的课题研究。文章中提到了gem5模拟器集成了DRAM power down模式,我想知道这个工具是否适合初学者使用?有哪些学习资源可以推荐?

回答: 同学你好!看到有学生对硬件节能研究感兴趣,真的很欣慰。gem5作为开源的完整系统模拟器,确实是一个很棒的研究工具。2018年研究人员将DRAM power down模式集成到gem5中后,它成为了首个公开可用的支持此功能的完整系统模拟器-9

对于初学者来说,gem5有一定的学习曲线,但绝对值得投入时间。我建议你可以先从gem5官网的教程和文档开始,那里有最基础的安装和使用指南。特别关注与DRAM控制器和电源管理相关的模块。

你的研究可以从小处着手,比如先尝试重复论文中的实验,使用他们提到的基准测试程序-9。也可以从简单的参数调整开始,观察不同power down策略对系统性能和功耗的影响。

学术界有很多使用gem5进行DRAM功耗研究的工作,你可以查找相关论文并尝试复现他们的实验方法。记住,动手实践比单纯阅读能学到更多。加油,未来计算机节能技术的发展就需要你们这样的新鲜血液!