上海华为全联接大会的舞台上,聚光灯下徐直军宣布自研HBM内存时,台下数百名工程师的掌声中混杂着如释重负的叹息。

华为轮值董事长徐直军在华为全联接大会上公布了昇腾芯片演进和目标,他坦言:“由于我们受到美国的制裁,不能到台积电去投片,我们单颗芯片的算力相比英伟达是有差距的。”-6

但紧接着他话锋一转,宣布了华为自研高带宽内存的计划——昇腾950PR芯片将于2026年第一季度推出,将采用华为自研HBM-6


01 技术突围

2025年9月的华为全联接大会舞台,成了中国半导体自立道路上的一个标志性时刻。徐直军站在台上,背后屏幕显示着“昇腾芯片演进与目标”几个大字。

他透露了华为未来三年的芯片规划,包括昇腾950PR、950DT以及昇腾960、970-1。这些芯片中,最引人注目的莫过于2026年第一季度将对外推出的昇腾950PR,因为这款芯片将搭载华为自研的HBM高带宽内存-1

华为自研HBM分为两个版本:HiBL 1.0和HiZQ 2.0-1。技术规格显示,HiBL 1.0容量为128GB,带宽达到1.6TB/s;而更高端的HiZQ 2.0则提供144GB容量和惊人的4TB/s带宽-4

这些数字意味着什么?简单来说,华为的HBM技术已经达到了行业先进水平,有能力支撑起下一代AI大模型的训练和推理需求。

02 内存竞赛

在全球HBM市场上,三星电子和SK海力士长期以来形成了实质性的寡占格局-3。这种市场结构让全球AI芯片开发者,在高端存储领域缺乏足够的选择权和议价能力。

美国在2024年12月初宣布限制向中国出口先进的HBM芯片-6这种出口管制反而加速了中国自主研发HBM的进程。华为挺进HBM战局,正是这一背景下的必然选择。

与简单地模仿现有HBM产品不同,华为似乎瞄准了定制化高带宽存储器的方向-7。这种差异化策略可能使华为在特定应用场景下,提供比通用HBM产品更优的解决方案。

从产业视角看,华为自研HBM不仅仅是技术上的突破,更是中国存储产业自主化进程中的重要里程碑。随着长鑫存储计划在2025年底至2026年间量产HBM3存储器-9,中国在高端DRAM领域正逐步构建起完整的产业链。

03 软件定义存储

在硬件受限的情况下,华为展示了其通过软件创新提升系统性能的能力。华为推出的UCM(统一缓存管理器)技术,通过智能数据分层管理,显著提高了存储系统的整体效率-5

根据测试数据,UCM技术能使First Token的生成延迟缩短90%,模型上下文记忆范围扩展10倍,整体吞吐率提升高达22倍-9。这种软件层面的创新,有效弥补了硬件上的暂时差距

UCM的工作原理相当精妙:它将数据依访问频率存放在不同层级的存储器中-5。最即时、最常用的热数据被放置在HBM中;中期需要的数据则下放至DRAM;而大量低频访问的冷数据则下沉到SSD-9

这种智能数据管理策略,让有限的HBM资源能够发挥最大效能。事实上,从产业角度看,华为UCM并非要取代HBM,而是提升其使用效能-9,使获取的有限资源发挥最大作用。

04 生态布局

华为的HBM战略并非孤立存在,而是其整体算力布局的一部分。徐直军在大会上提出了雄心勃勃的目标:基于昇腾950芯片打造全球最强的超节点-6

华为计划打造的Atlas 950 SuperPoD将拥有8192个NPU,算力高达8 EFLOPS FP8,内存带宽达16.3 PB/s,训练总吞吐4.91mn TPS-8。而基于昇腾960的SuperPoD更将拥有15488卡(NPU),算力高达30 EFLOPS FPB/60 EFLOPS FP4-8

与英伟达计划在2027年推出的NVL576系统相比,华为宣称其基于昇腾950芯片的超节点将更加强大-6。这种自信来源于华为在联接技术上的长期积累——三十多年“联人、联机器”的经验-6

华为HBM的研发也受益于中国存储产业链的整体进步。中国存储厂商正全面导入本土EDA工具,华大九天等公司已建立多个全流程EDA工具,涵盖内存、射频与平板显示电路等领域-5

05 市场影响

华为自研HBM的消息一出,立即在业界引起广泛关注。有分析指出,华为在AI算力上的布局比英伟达更加全面,涵盖自研芯片、HBM内存、系统等几乎全产业链环节-8

难怪英伟达CEO黄仁勋曾直言,华为AI芯片取代英伟达只是时间问题-8。这种判断基于一个简单事实:华为正在构建一个更加自主、完整的AI算力生态系统

对于中国AI产业来说,华为自研HBM意味着什么?首先,它提供了供应链上的备选方案,降低了对单一供应商的依赖。定制化的HBM可能更好地适配中国AI应用场景的特殊需求。

徐直军预测,到2035年算力需求将激增10万倍-2。面对如此巨大的市场需求,华为自研HBM不仅关乎企业竞争力,也关系到国家算力基础设施的自主可控


当华为自研HBM内存的细节逐渐公开,行业观察者开始仔细审视这些数字背后的意义:HiZQ 2.0版本144GB容量和4TB/s带宽的参数-4,已经接近国际主流产品水平。

徐直军站在台上平静地说:“我们将以一年一次算力加倍的进度推进。”-6 这句话轻描淡写地带过了华为在联接技术上实现的突破——正是这种技术,使得华为能够打造万卡级的超节点,在系统层面实现世界领先的算力-6

华为HBM的故事才刚刚翻开第一页,而这本书的后续章节,将由中国半导体产业的无数研发人员共同书写。

网友提问与回答

网友问:华为自研的HBM和三星、SK海力士的产品相比,到底有什么不同?是单纯模仿还是真有创新?

:您这个问题提得很到位,也是很多业界观察者关心的话题。从已公布的信息来看,华为自研HBM确实有它的独特之处。

首先在规格上,华为推出了两个版本:HiBL 1.0和HiZQ 2.0-1。HiZQ 2.0提供144GB容量和4TB/s的带宽-4,这个参数已经达到了行业主流水平。但华为可能更加注重的是定制化和与自家AI芯片的深度协同

有分析指出,华为瞄准的是定制化高带宽存储器市场-7,这意味着它的HBM可能针对昇腾AI芯片的特殊架构进行了优化。比如在昇腾950PR和950DT芯片中,不同版本的HBM被设计用来优化不同的计算阶段——HiBL 1.0用于提升推理Prefill性能,而HiZQ 2.0则专注于提升训练性能和解码阶段效率-1

这种芯片与内存的协同设计可能带来整体能效的提升。考虑到华为面临的外部环境,自研HBM还承载着供应链安全的战略意义。美国对先进HBM芯片的出口限制-6,使得自主研发成为必然选择。

所以,它不完全是模仿,而是在现有技术路径上的创新应用和差异化发展。

网友问:华为自己做HBM,会不会抢了国内其他存储厂商的生意?比如长鑫存储也在研发HBM-9

:这是一个非常实际的产业生态问题。从表面上看,华为进入HBM领域似乎会与长鑫存储等国内存储厂商形成竞争关系,但实际上情况可能更加复杂和积极。

首先,华为自研HBM和国内存储厂商的发展可以形成良性互补。华为主要将HBM用于自家的昇腾AI芯片,满足自身AI算力产品的需求。而长鑫存储的HBM产品则可以面向更广泛的市场,服务更多的客户。

华为在HBM领域的研发经验和市场需求,实际上能够带动整个国内HBM产业链的成熟。从EDA工具到制造工艺,华为的需求会推动上游供应链的发展,这些成果同样可以被长鑫存储等厂商共享。

事实上,中国存储产业正全面导入本土EDA工具-5,这种产业链的共建共享对所有参与者都有利。华为和长鑫存储可能在技术研发、标准制定等方面还有合作空间。

从更大的视角看,中国需要在高端存储领域有多个玩家,才能形成健康的产业生态,避免单一供应商的风险。所以华为自研HBM与其说是抢生意,不如说是共同做大国内市场蛋糕,增强整个国产存储产业的竞争力。

网友问:普通用户什么时候能体验到搭载华为自研HBM的产品?这对我们使用AI服务有什么实际影响?

:这是一个贴近用户视角的好问题。对于普通用户来说,搭载华为自研HBM的产品体验可能比预期来得更间接但也更广泛。

从时间线上看,首款搭载华为自研HBM的昇腾950PR芯片预计在2026年第一季度推出-2。但这主要是面向企业和云服务商的数据中心产品,普通用户不会直接购买。

普通用户的体验将主要通过云端的AI服务来感受。当百度文心一言、阿里通义千问等国内大模型使用基于华为HBM的昇腾芯片进行训练和推理时,您可能会发现AI生成内容的速度变快了,回答更加精准了,能处理的上下文更长了。

具体来说,华为UCM技术能将AI模型生成第一个Token的延迟缩短90%-9,这意味着您向AI提问后,等待首次响应的时间将大大减少。同时,模型上下文记忆范围扩展10倍-9,AI就能记住更长的对话历史,进行更连贯的交流。

长期来看,华为自研HBM将帮助降低国内AI算力的成本,使更多企业能够负担得起大规模AI模型的训练和部署。这最终会使AI技术更普及,催生更多创新的AI应用,让普通用户在日常工作和生活中感受到AI带来的便利。

所以,虽然您不会直接“购买”华为HBM,但您使用的各种AI服务背后,很可能正受益于这项技术的进步。