The industrial chain update is accelerating comprehensively! NVIDIA announces "One Iteration per Year"

HBM4 存储器和 3.2T 光模块，或在 2026 年成为主流。

本文作者：张逸凡

编辑：申思琦

来源：硬 AI

在 Computex 2024 上，黄仁勋（Jensen Huang）手持 Blackwell 芯片，再一次证明了英伟达的全栈能力。

相比于 GPU 卖家，全栈厂商需要考量的不再仅仅是 GPU，还包括软件平台、网络服务、散热产品、配套 CPU 等产品。

英伟达 CEO 黄仁勋在此次大会上给出了一一的解答。

• 芯片一年一迭代：2025 年推出 Blackwell Ultra GPU、2026 年推出 Rubin GPU、2027 年推出 Rubin Ultra GPU；

• 推出下一代架构：2026 年推出下一代架构 Rubin；

• Spectrum-X“年更”：2026 年，Spectrum-X1600 可连接数百万个 GPU；

• 散热不局限于 “液冷”：Blackwell 架构同时推出风冷 DGX 和液冷 MGX 两款服务器；

• 软件平台：软件业务不仅是英伟达护城河，而且会成为一个巨大的生意；

一、处理器

首先，还是先来看一下英伟达的处理器，分别是 GPU 和 CPU。

会议上，黄仁勋说，“接下来更新节奏将以一年为周期，把所有产品推向技术极限。”

并重磅披露了未来三代的技术栈（见下图）：

• 2025 年推出 Blackwell Ultra GPU（8S HBM3e 12H）；

• 2026 年推出 Rubin GPU（8S HBM4），以及新一代基于 Arm 的 Vera CPU，以及 NVLink 6 Switch（3600GB/s）；

• 2027 年推出 Rubin Ultra GPU（12S HBM4）；

性能上，Rubin GPU 和 vera CPU 的具体参数暂未披露。但是英伟达在模型训练上已经充分体现了体能提升，价格下降这一宗旨：

• 过去 8 年，1.8 万亿参数 GPT-4 的训练能耗，直接疯狂降到 1/350，推理能耗降至 1/45000；

• 过去 8 年，算力提升了 1000 倍；

二、处理器架构

黄仁勋揭露了 Blackwell 的下一代架构将是 Rubin 架构，将于 2026 年首次推出。新亮点是将配备HBM4 内存。

根据外媒 wccftech 报道，英伟达的 Rubin GPU 将采用台积电的 CoWoS-L 先进封装技术，并采用 N3 制程工艺。

此外，英伟达将为 2026 年推出的 Rubin GPU 配备下一代HBM4 内存。目前，英伟达在其 B100 GPU 中使用的是最快的 HBM3E 内存。

这意味着在 2025 年底，HBM4 内存可能就会大规模生产。

另外，英伟达还将推出基于 ARM 架构的新一代 CPU —— Vera CPU，与 Rubin GPU 搭配，形成全新的 Vera Rubin 平台超级芯片。该平台将支持新的 CX9 SuperNIC 和 NVLink 6 技术，提供高达 1600GB/s 和 3600GB/s 的连接速度。

三、通信网络 —— 以太网

此次大会上，英伟达首次提到了百万级 GPU 互连的以太网络解决方案，且预计将于 2026 年推出。届时，3.2T 光模块或将成为主流。

“数百万 GPU 数据中心的时代即将到来！” 黄仁勋会上，出了未来三年的以太网络 Spectrum 产品路线，并宣布将每年推出新的 Spectrum-X 产品。

• 2024 年，Spectrum-X800 为数万个 GPU 而设计；

• 2025 年，X800 Ultra 为数十万个 GPU 而设计；

• 2026 年，X1600 则可扩展至数百万个 GPU；

先前，不论是 Arista 还是英伟达，都仅公布了十万级别的 GPU 连接产品：

• 英伟达：Spectrum-X 已经与多家客户进入了量产阶段，其中包括一个 10 万 GPU 的大型集群；

• Arista：预测公司在 2025 年可以连接 10 万 GPU；

根据会议（见下图），2026 年交换机速率较 2024 年将会翻倍，意味着 2026 年光模块或将进入 3.2T 时代（目前是 1.6T）。

四、风冷 DGX 和液冷 MGX

Blackwell 推出后，市场一度传出服务器将使用液冷来散热。

此次大会上，英伟达提到，将同时构建风冷 DGX 和液冷 MGX两种散热模式的服务器产品。

此外，相比于先前的 GTC 大会，黄仁勋披露了更详细的 Blackwell 架构的数据：

• DGX 的 AI 算力提升到上一代的 45 倍，达到 1440PFLOPS，而能耗仅为上一代的 10 倍；

• 新一代 DGX 能搭载 72 个 GPU，背后由 NVLink 5000 根电缆组成的主干支持，能为一个机架节省 20kW 电能；

五、软件开发平台

软件业务不仅是英伟达护城河，而且会成为一个巨大的生意。

这些软件业务包括：CUDA、NIM、Omniverse 等（见下图）。

会议上，英伟达再次强调了 NIN 和 Omniverse 的重要性，

1）NVIDIA NIM 推理微服务能将企业部署生成式 AI 应用的时间从几天压缩到几分钟；

2）Omniverse：Omniverse 是一个虚拟世界模拟开发平台，该平台可以最大限度地减少模拟与现实的差距。开发者可以在 Omniverse 中测试、训练和集成所有东西。正如视频所说，机器人可以在虚拟世界里学习如何成为机器人；

面向未来，英伟达积极布局了机器人领域、以及开发基于 AI 技术的应用——Earth。通过不断创新和探索，英伟达有望在推动全球技术进步和改善人类生活方面发挥更大的作用。

The industrial chain update is accelerating comprehensively! NVIDIA announces "One Iteration per Year" | AI Dehydration

一、处理器

二、处理器架构

三、通信网络 —— 以太网

四、风冷 DGX 和液冷 MGX

五、软件开发平台