深夜城市高架上,特斯拉FSD系统流畅地处理着暴雨中模糊的车道线和突然加塞的车辆,背后是每秒钟数百GB数据在特制内存中的疾速奔流。
那个熟悉的特斯拉Logo正在从一家电动汽车公司,悄然转变为一个垂直整合的人工智能巨兽。

马斯克在最近一次股东大会上毫不掩饰地宣布,特斯拉的未来市值将超过8.5万亿美元,比英伟达和台积电的市值总和还要高出八个丰田-2。实现这一宏伟蓝图的核心,正是特斯拉在计算架构上的颠覆性创新。

特斯拉DRAM模型的故事要从HW3.0说起,那时特斯拉还像是个精打细算的工程师。HW3.0使用的只是8片2GB的LPDDR4内存,总容量16GB,成本大约只有28美元-1。
这和传统汽车厂商的思路似乎没什么不同——选择成熟、稳定、成本可控的方案。
到了HW4.0时代,特斯拉的画风突变,直接跨入了GDDR6的领域。车载领域此前都是使用LPDDR系列,特斯拉这次成了第一个吃螃蟹的人-1。
硬件配置大幅升级:HW4.0中的第二代FSD使用了16颗GDDR6内存,每颗容量2GB,总容量达到32GB。这还没完,特斯拉的座舱控制器里还额外塞进了4颗GDDR6,又是8GB的容量-1。
这样的配置在汽车行业堪称奢侈。相比之下,英伟达中配Orin开发盒子使用的是4颗8GB的LPDDR5,总容量32GB,成本大约50-60美元-1。
而特斯拉HW4.0的GDDR6内存成本高达200美元以上,比对手贵出150美元-1。这种不惜血本的投入,背后是对自动驾驶算力需求的清醒认知。
要理解特斯拉DRAM模型的转变,需要先明白一个核心问题:对于AI计算来说,什么最重要?
答案是带宽。CPU处理数据时更看重速度,而AI和GPU是并行计算,带宽比速度更加关键-1。
AI运算本质上是矩阵乘积累加,需要频繁读取训练好的模型参数。模型越大,参数越多,对内存带宽的要求就越高-1。
自动驾驶领域目前使用的Transformer模型参数在9千万到3.4亿之间,而机器视觉的ViT变种已经达到20亿参数-1。与GPT3的1750亿参数相比,自动驾驶模型还有巨大的增长空间。
特斯拉DRAM模型从LPDDR转向GDDR的核心逻辑就在这里。特斯拉初代FSD使用的LPDDR4,带宽约为273GB/s-1。而HW4.0使用的16颗GDDR6内存带宽达到了896GB/s,是初代的三倍多-1。
这种带宽飞跃直接转化为自动驾驶系统处理复杂场景的能力。当你的特斯拉在暴雨中识别模糊的车道线,或者在密集车流中预判潜在风险时,正是这些高带宽内存确保神经网络能够快速访问海量参数,做出毫秒级的决策。
特斯拉对DRAM模型的探索远未停止。韩国的SK海力士已经传出消息,将开始生产基于10纳米级第六代1c DRAM的GDDR7,而预期的主要客户就包括特斯拉-4。
这一升级可能配合特斯拉的新产品上市时间,最快从2026年开始加速扩产-4。
更引人注目的是特斯拉即将推出的AI 5芯片。根据马斯克在股东大会上的展示,AI 5将拥有9倍于AI 4的内存容量-2。
AI 4两颗芯片共有32GB内存,按此推算AI 5的内存容量可能达到惊人的288GB-2。
内存配置上,AI 5芯片可能会配备12枚内存颗粒-2。而三星即将工规/车规化的HBM3内存正好是24GB起步,12枚正好288GB-2。这意味着AI 5可能会采用带宽超过1TB/s的HBM3内存,这将是人类首次将如此高带宽的芯片放进车里-2。
这种内存配置将带来计算性能的飞跃。AI 4单片算力约360TOPS,而AI 5可能达到单芯片3000TOPS甚至7200TOPS的算力-2。
作为对比,英伟达的Thor-U芯片带宽为273GB/s,蔚来神玑带宽为546GB/s-2。特斯拉通过DRAM模型的创新,正在计算性能上建立巨大优势。
有趣的是,特斯拉在不同场景下对DRAM模型的选择截然不同。在车载推理领域,特斯拉选择了高带宽的GDDR系列;而在云端训练领域,特斯拉却走了一条完全不同的路。
特斯拉的Dojo超级计算机系统在设计时曾考虑使用DRAM,但最终选择了更昂贵的SRAM-6。
DRAM更便宜,更容易做大容量,但能耗更高,速度更慢;SRAM则更贵,容量小,但速度更快能耗更低-6。对于需要高计算资源利用率的训练系统来说,高带宽和低延迟至关重要,这正是SRAM的优势所在-6。
这种分场景优化的思路体现了特斯拉对计算需求的深刻理解。车载环境需要平衡性能、功耗和成本,因此选择了性价比更高的GDDR;而云端训练更追求极致性能,愿意为速度和能效付出更高成本。
两个世界的不同选择,却指向同一个目标:加速自动驾驶技术的迭代。某些复杂工程的训练时间在Dojo出现之前已经需要按月计算,而Dojo系统能大幅缩短这一时间-6。
这意味着特斯拉能够更快地改进FSD系统,将新算法部署到数百万辆车上,形成数据和算法的正向循环。
当Model 3的DRAM容量从14GB迈向下一代车型的20GB时-5,传统车用DRAM市场正在被重新定义。美光占据近五成份额的领域-5,特斯拉正用GDDR6撕开一道口子,而GDDR7的预备量产-4与AI5芯片9倍内存容量的蓝图-2,已经将战火引向了下一个战场。
特斯拉的每一次DRAM模型升级,都在重新划定自动驾驶的起跑线。高带宽内存正成为智能汽车的新引擎,而特斯拉已经踩下了第一脚电门。
问:特斯拉在内存上这么“堆料”,对我们普通车主来说,实际驾驶体验真的能有明显提升吗?还是只是参数好看?
绝对是实打实的体验提升!这就像给你的车换了一个更强大的“大脑”。更高的内存带宽意味着你的特斯拉能同时处理更多摄像头和传感器的数据,在复杂路况下反应更快、更稳。
举个例子,当你在城区开FSD时,系统要同时识别车道线、行人、自行车、红绿灯、路标等等。内存带宽不足的话,就像高峰期堵车的高速公路,数据“堵”在那儿处理不过来,系统就可能反应迟钝甚至出错。
而特斯拉DRAM模型升级到GDDR6后,带宽达到896GB/s,是之前的三倍多-1,相当于把四车道高速扩成了十二车道,数据流转畅多了。尤其在雨雪天气、夜间驾驶这些挑战性场景下,提升会更明显。
问:特斯拉在内存上的选择和其他车企有什么不同?这种差异会导致未来智能驾驶能力拉开差距吗?
特斯拉和其他车企在内存选择上走的是两条不同的路。大部分车企选择的是LPDDR4或LPDDR5-1,这是更传统、更稳妥的方案。
而特斯拉直接从HW4.0开始用上了GDDR6,这是从显卡领域“跨界”过来的技术-1,带宽高得多,但也更贵、功耗更大。
这种差异有点像智能手机早期,有的厂商堆CPU性能,有的优化系统流畅度。短期看,不同路径各有优劣;但长期看,高带宽路线可能后劲更足。
因为自动驾驶AI模型会越来越大,参数会越来越多-1,对内存带宽的需求只会增加。特斯拉现在每年在每辆车上多花150美元内存成本-1,换来的是为未来3-5年的算法升级预留了空间。
当其他车企的硬件跟不上新一代算法时,特斯拉车主可能通过一次OTA就获得了全新体验。这种“硬件超前”策略,可能正是未来智能驾驶能力分化的关键。
问:看到消息说特斯拉的Dojo训练系统反而不用DRAM用SRAM,为什么同一家公司对内存的选择这么“精神分裂”?
这不是精神分裂,而是精准的场景化选择,特别体现特斯拉的工程师思维。在车上用GDDR,在Dojo训练系统用SRAM,是因为两者的需求完全不同。
车载芯片要的是平衡——性能要好,功耗不能太高,成本也得可控。GDDR就是平衡之选,比LPDDR带宽高,比HBM便宜-1。
而Dojo是训练超大规模AI模型的“超级大脑”-6,放在数据中心,不用太考虑成本和功耗,极致性能才是王道。SRAM比DRAM贵很多,但速度更快、延迟更低-6。
这就好比短跑运动员和马拉松选手的装备选择不同一样。特斯拉的聪明之处在于,不为技术而技术,而是根据实际需求选择最合适的方案。
这种务实态度可能比单纯追求参数更可怕,意味着他们真正理解不同场景下的计算需求,不会为了统一而牺牲效率。