1月8日,英伟达首席执行官黄仁勋在CES2026展会上回应了关于是否用SRAM取代HBM的问题。SRAM是一种高速小容量的静态缓存,而HBM是基于DRAM的3D堆叠式主存,具有超高带宽和大容量。黄仁勋承认SRAM在某些特定工作负载下速度极快,但在生产级AI系统中,SRAM的容量瓶颈使其优势不再。他指出,SRAM的容量增长速度跟不上现代模型的需求,可容纳的模型规模仅为HBM系统的百分之一。当模型溢出SRAM时,系统效率优势会瞬间消失。
黄仁勋进一步分析了AI工作负载的不可预测性。现代AI模型形态各异,对硬件的需求点不同,有的依赖显存容量,有的依赖互连带宽。如果硬件针对某一特定模式过度优化,一旦工作负载变化,昂贵的芯片就会闲置。因此,英伟达坚持选择HBM路线。黄仁勋认为,在共享数据中心中,灵活性是决定经济效益的关键。HBM方案虽然物料成本更高,但能适应不断变化的算法和模型架构,确保硬件在数周甚至数月的运营周期内保持高利用率。
