手机玩游戏卡成PPT、视频加载转圈圈,这些让人抓狂的瞬间背后,是计算机架构七十年来未曾解决的顽疾——但达摩院用一块芯片找到了突破口。
2021年底,阿里达摩院宣布成功研发出全球首款基于DRAM的3D键合堆叠存算一体AI芯片-1。在特定AI场景中,该芯片性能提升了10倍以上,能效比更是飙升300倍-4。

这项技术突破意味着,未来我们的手机、自动驾驶系统和各种智能设备可能会告别卡顿与高耗电的困扰。

咱们先聊聊现在用的计算机,基本上都遵循着七十多年前冯·诺依曼提出的架构设计。这种架构简单说就是把计算和存储分开,就像厨房和仓库隔得老远-2。
每次做菜(计算),都得跑去仓库(内存)拿食材(数据),做完再送回去。这一来一回不仅浪费时间,还特别耗能。
尤其是在人工智能这种需要大量数据处理的情况下,数据搬运消耗的能源竟然是计算本身所需的约200倍-2。这就好比为了炒盘菜,你花在跑腿上的力气比炒菜本身多200倍,太不划算了!
更糟的是,处理器性能每两年增长约3.1倍,而内存性能提升只有1.4倍-2。这种失衡导致即使有强大的计算能力,也会因为“食材供应不上”而发挥不出来。我们手机用久了变卡,部分原因就是这个。
达摩院这次搞的存算一体芯片,思路挺巧妙的——直接把厨房和仓库合并。
他们不是简单地把内存和处理器放在一起,而是采用了创新的“混合键合3D堆叠技术”-7,让计算芯片和存储芯片“面对面”紧密结合。
这种设计有多牛呢?达摩院的芯片内存单元采用了异质集成嵌入式DRAM,特点是带宽超大、容量也超大-5。
这么说可能有点抽象,举个例子吧:就像原本需要从城东跑到城西取货的快递站,现在直接把仓库建在了分拣中心楼上,快递到了直接下楼就能处理,效率能不高吗?
这项达摩院DRAM技术最厉害的地方在于,它专门针对推荐系统等AI场景做了端到端优化-9,从数据匹配、排序到神经网络计算一条龙服务。
可能有人会觉得,这种高科技离我们日常生活很遥远吧?其实不然。达摩院的这款存算一体芯片已经展现出惊人实效-1。
在实际推荐系统应用中,相比传统CPU计算系统,性能直接提升10倍以上,能效提升超过300倍-4。
想象一下,以后刷购物APP,推荐商品不仅更准确,而且加载速度飞快;看短视频时,平台推送的内容会更合你胃口,还不会让手机发烫耗电。
这可不是空想,这项研究成果已经被芯片领域顶级会议ISSCC 2022收录-5,表明其技术价值获得了国际认可。
达摩院计算技术实验室科学家郑宏忠说得挺到位:“存算一体是颠覆性的芯片技术,它天然拥有高性能、高带宽和高能效的优势”-7。
达摩院DRAM技术的应用前景其实远超我们想象。除了让手机更流畅,这项技术未来可应用于VR/AR、无人驾驶、天文数据计算、遥感影像数据分析等多个前沿领域-5。
想想看,在无人驾驶场景中,车辆需要实时处理海量传感器数据并做出即时决策。传统的计算架构可能因为数据传输延迟而导致反应不够快,存算一体技术则能大幅减少这种延迟,让自动驾驶更安全可靠。
在天文数据计算方面,科学家们每天都要处理来自太空的庞大数据流。达摩院的这种芯片架构能显著提升数据处理效率,帮助人类更快地探索宇宙奥秘。
当然,目前整个行业对存算一体芯片技术的研究仍处于探索阶段-2,在工艺成熟度、典型应用、生态系统等方面还需要不断完善。
但达摩院已经迈出了重要一步,他们计划先研究基于三维堆叠的近存芯片,通过拉近存储单元与计算单元的距离来降低数据搬运的代价-1。
达摩院这次突破可能会引发整个芯片行业的连锁反应。过去几十年,业界对存算一体芯片的研究进展缓慢,主要受限于技术复杂度高、设计成本昂贵以及应用场景匮乏-4。
但现在情况不同了。随着AI等新兴技术对算力的需求日益增长,传统架构已经捉襟见肘。达摩院的成功研发可能会激励更多企业和研究机构加大在这一领域的投入。
这不仅仅是技术竞赛,更关乎未来计算领域的话语权。谁能在这个新时代的起跑线上占据优势,谁就能在未来的智能世界中掌握更多主动权。
达摩院计算技术实验室在这方面已经积累了不少成果,在ISSCC、ISCA、MICRO、HPCA等顶级会议上发表过多篇论文-1。他们的研究也将用于阿里巴巴旗下半导体公司平头哥的芯片产品研发-2。
当达摩院的存算一体芯片从实验室走向广阔市场,自动驾驶汽车正实时处理海量传感器数据,VR设备呈现着无延迟的沉浸世界,手机推荐算法精准如私人助手。
那枚基于DRAM的3D键合芯片,已经悄然点亮了算力自由的第一盏灯。
@科技探索者: 达摩院这个存算一体芯片听起来很厉害,但它和现在手机里常用的芯片有什么本质区别?普通消费者什么时候能用上相关产品?
这个问题问得很实在!达摩院的存算一体芯片和传统芯片最核心的区别在于架构革命。现在的手机芯片基本还是遵循冯·诺依曼架构,计算和存储是分开的;而达摩院的芯片将两者融合在一起,就像把厨房和仓库合二为一-2。
对普通消费者来说,这种芯片最初可能会先应用于云端服务器,改善咱们使用各种APP的体验。比如刷短视频时推荐更准、购物APP加载更快。达摩院计划与阿里内部业务紧密合作,逐步针对内部AI应用场景适配优化-1。
至于直接用在手机上,可能还需要一些时间。主要挑战在于要将这种新技术小型化、低功耗化,同时控制成本。但方向已经明确,一旦技术成熟,未来手机可能会因此变得更智能、更省电、更快速。
@硬件爱好者: 文中提到这款芯片采用了“混合键合3D堆叠技术”,能通俗点解释这是什么黑科技吗?和台积电的3D封装技术有什么不同?
哎呀,这个问题问到点子上了!“混合键合3D堆叠技术”听起来高大上,其实可以理解为芯片间的“超精密焊接”。传统芯片封装像是用胶水把两个芯片粘在一起,而混合键合则是让两个芯片的金属层直接原子级结合,面对面对接-7。
这样做的好处是连接距离极短,数据传输速度超快,而且能效更高。达摩院用这种技术把计算芯片和存储芯片直接“焊”在一起,实现了真正的存算一体-4。
和台积电的3D封装技术相比,达摩院这项技术更专注于解决存算分离的核心问题,是专门为打破“内存墙”而设计的。台积电的3D封装更多是通用技术,而达摩院的技术则是针对特定问题的高度定制化解决方案。两者都有价值,但目标不同。
@行业观察员: 存算一体芯片是未来趋势吗?达摩院这次突破在国际上处于什么水平?会不会引发新一轮芯片技术竞赛?
我的看法是,存算一体绝对是未来芯片发展的重要方向之一。随着人工智能、大数据应用爆炸式增长,传统架构已经越来越力不从心。达摩院科学家郑宏忠说得对,这是“颠覆性的芯片技术”-5。
在国际水平方面,达摩院研发的这款芯片是全球首款基于DRAM的3D键合堆叠存算一体AI芯片-1,这个“首款”已经说明了它的领先地位。而且相关论文被芯片领域顶级会议ISSCC 2022收录-5,国际认可度也很高。
技术竞赛肯定会被进一步激发。事实上,存算一体概念上世纪90年代就提出了,但之前几十年进展缓慢-4。达摩院的突破像是点燃了导火索,预计会有更多企业和研究机构加大投入。这不仅是技术竞争,更是未来智能时代基础设施的角逐。