地时间 3 月 18 日周二,英伟达 CEO 黄仁勋在加州圣何塞举行的英伟达 AI 盛会 GTC 2025 上发表主题演讲。黄仁勋说,去年的 GTC 大会被誉为 AI 领域的 Woodstock 音乐节,今年 GTC 被称为 AI 行业的美版春晚 “超级碗”,这两种称呼的唯一区别是,在 “超级碗”,每个人都是赢家。黄仁勋演讲覆盖了 AI 科技演进以及计算需求、即 AI 扩展定律的预测,同时公布了英伟达的 Blackwell 架构最新一代产品、此后几代产品的计划出货时间,英伟达在机器人领域合作研发的进展。要点包括:我们将迈向代理式 AI 时代,接着是物理 AI、即机器人时代,AI 扩展定律、即计算需求在超快提速。去年美国云服务商四巨头购买 130 万块 Hopper 架构芯片,今年已购 360 万 Blackwell 芯片,预计 2028 年数据中心资本支出规模突破 1 万亿美元。通用汽车将用英伟达技术帮助开发自动驾驶汽车,英伟达推出汽车安全 AI 解决方案 Halos;英伟达将与 T-Mobile 等电信公司合作开发用于 6G 的 AI 网络。Blackwell 架构全面投产,客户需求 “难以置信”。推出 “AI 工厂操作系统” Dynamo,Blackwell NVLink72 芯片搭载 Dynamo 的推理性能是 Hopper 的 40 倍;Blackwell 架构新品 Ultra NVL72、即 GB300 预计今年下半年出货,下一代 Rubin 架构的 Vera Rubin NVLink 144 明年下半年后出货,之后一代 Rubin Ulta NVL576 将 2027 年下半年出货。AI 电脑 DGX Spark 和 DGX Station 采用 Blackwell 芯片。英伟达推出全球首款人形机器人功能模型 GR00T N1,同 DeepMind 和迪士尼合作开发机器人模拟用开源物理引擎 Newton,GR00T N1 加持的机器人 Blue 和黄仁勋同台亮相,黄称 “通用机器人时代已到来” 。黄仁勋重申了他近几个月来提出的观点:“AI 算力很容易比我们去年此时认为的要多 100 倍”将迎来代理式 AI 时代 接下来物理 AI AI 扩展定律超快提速他首先介绍了 AI 研发的发展历程,从最初的意识 AI(Perception AI),到现在的生成式 AI(Generative AI),他预计我们将进入代理式 AI(Agentic AI)的时代,接下来将是物理 AI(Physical AI)、也就是机器人的时代。黄仁勋说,现在我们正在了解如何扩展 AI,未来必须关注训练和扩展构建的 AI 模型。他介绍 AI 的扩展定律(scaling law)发展演化,从预训练扩展、训练后扩展到测试时间扩展,即 “长思维”。黄仁勋认为去年行业对计算需求判断错误。他说:“计算的需求、即 AI 的扩展定律更具韧性,而且实际上速度在超快提高(hyper-accelerated)。”英伟达周二当天发布针对开发者和企业的开源 AI 模型系列,帮助他们打造 Agentic AI 平台,并针对企业发布 Blackwell Ultra DGX SuperPOD。四大美国云服务商今年已购 130 万 Blackwell 芯片黄仁勋表示,现在我们 “进行推理所需的计算量比以前大大增加”,而能够进行的数据和人工训练是有限的。未来将由人类编写软件过渡到由 AI 模型运行软件黄仁勋介绍,AI 计算相关的基础设施增长正处于转折点。他透露,2024 年,美国前四大云服务提供商(CSP)、所谓超大规模云服务商(hyperscaler)购买了 130 万块英伟达的 Hopper 架构芯片,2025 年,又购买了 360 万 Blackwell 架构芯片。黄仁勋预计,2028 年,建设数据中心投入的资本支出将超过 1 万亿美元。黄仁勋展示了英伟达简化加速平台处理与数据和 AI 等领域采用的 CUDA-X 库,称 AI 加速服务于多种行业各行各业都可应用 CUDA-X 库,称这只是实现加速计算的库的一小部分。黄仁勋预测,每家公司未来都将有两个工厂,一是用于生产产品,另一个用于 AI 数学。黄仁勋称,AI 将进入所有行业。与通用汽车合作开发自动驾驶汽车 与 T-Mobile 等公司合作开发用于 6G 的 AI 网络黄仁勋宣布,英伟达将扩大与通用汽车的合作。通用汽车将运用英伟达的技术帮助开发自动驾驶汽车,用英伟达的技术训练 AI 制造模型。英伟达推出了专注于汽车安全的 AI 解决方案,名为英伟达 Halos。黄仁勋说:“我相信,我们是世界上第一家对每一行代码都进行安全评估的公司。”黄仁勋还宣布,英伟达将与思科和 T-Mobile 等公司合作,研究和开发用于下一代无线网络 6G 的 AI 原生网络。Blackwell 架构全面投产 NVLink72+Dynamo 推理性能是 Hopper 的 40 倍谈到数据中心,黄仁勋称,Blackwell 架构的芯片已经全面投产,“客户需求令人难以置信(incredible)。”他再次展示了今年 1 月 CES 上他演示的超级芯片 Grace Blackwell NVLink 72。它在一个晶圆上集成了 72 个 Blackwell GPU,并且有 18 个 NVLink Switch,实现 4 位浮点数 FP4 上 1.4 EFLOPS 的计算性能。英伟达推出号称未来 “AI 工厂操作系统” 的新开源软件 Dynamo。它是一个 “分布式推理服务库”,基本上是一个开源解决方案,用于解决无法提供足够用户所需 token 的问题。微软和 Perplexity 是 Dynamo 的首批合作伙伴。黄仁勋展示了 Blackwell 架构如何超越 Hopper 超级计算机。用 Grace Blackwell NVLink72 芯片搭载 Dynamo,Blackwell 架构相比 Hopper 架构可将性能提升 25 倍。“在推理模型中,Blackwell 的性能是 Hopper 的 40 倍。”黄仁勋开玩笑说,Hopper 足以胜任一些任务,而出了 Blackwell,“我是破坏收入的头子。” 有了 Blackwell 等最新技术加持,搭建 AI 工厂的厂商 “无论如何,你买得越多,就省得越多。”Blackwell Ultra NVL72 预计今年下半年出货 下一代 Vera Rubin 一年后出货黄仁勋宣布英伟达芯片新品的消息,Blackwell 系列的新品 Blackwell Ultra NVL72 平台将于今年下半年出货,它的带宽是前代 GB200 的两倍,内存速度是前代的 1.5 倍。Blackwell Ultra 有两个版本,一是基于 Arm 设计的 CPU,名为 GB300,另一个是名为 B300 的 GPU。英伟达称,Blackwell Ultra 平台为 AI 推理时代铺路。GB300 NVL72 采用机架级设计,连接 72 块 Blackwell Ultra GPU。相比 Hopper 架构,B300 NVL16 在大语言模型(LLM)上的推理速度提高了 11 倍,计算能力提高了 7 倍,内存增加了 4 倍,可为 AI 推理等最复杂的工作负载提供突破性的性能。黄仁勋还公布了 Blackwell 之后下一代 GPU 架构 Rubin AI 数据中心芯片的计划面世时间。英伟达预计,名为 Vera Rubin 的平台将于 2026 年下半年开始出货,它得到 NVLink 144 技术加持,包括名为 Vera 的英伟达首款定制 CPU 设计和名为 Rubin 的 GPU 设计。Vera Rubin NVLink 144 的性能将是 GB300 NVL 72 的 3.3 倍。相比三年前英伟达在 GTC 大会首次发布的前代 Grace CPU,Vera 芯片的性能提高一倍。Vera 基于 Olympus 核心设计,Vera 设计的速度将是去年采用 Blackwell 架构 CPU 的两倍。Rubin 在进行推理时可以达到每秒 50 千万亿次浮点运算(petaflops)的速度,比当前 Blackwell 芯片每秒 20 petaflops 的速度高出一倍多。Rubin 还可以支持高达 288 GB 的快速内存。Rubin 实际上是两块 GPU,从 Rubin 开始,英伟达会将两个或多个芯片组合成一个芯片,将它们成为一个单独的 GPU。Vera Rubin 之后,英伟达预计,下一代 Rubin Ultra NVL576 将于 2027 年下半年推出,其性能将是 GB 300 NVL72 的 14 倍。黄仁勋称,Rubin 之后的下一代架构名为 Feynman,名门来自著名物理学家理查德・费曼,该架构将于 2028 年亮相。AI 电脑 DGX Spark 和 DGX Station 采用 Blackwell 芯片黄仁勋宣布英伟达周二发布两款 AI 电脑,分别名为 DGX Spark 和 DGX Station,称它们是 “AI 时代的计算机”。这两款电脑都使用 Blackwell 架构的芯片。DGX Spark 采用 GB10 Grace Blackwell 超级芯片,外形类似 Mac-Mini。DGX Station 体积更大,由 GB300 Grace Blackwell Ultra Desktop 芯片驱动。DGX Spark 本周二开始接受预订,将在未来几个月内上市。DGX Station 将在今年晚些时候由华硕、戴尔、惠普等英伟达的合作伙伴发售。合作开发机器人模拟用开源物理引擎 Newton GR00T N1 模型加持的机器人 Blue 和黄仁勋同台英伟达播放了一段视频,展示如何进行机器人研究。包括使用 Omniverse 平台 和 Cosmos 仿真引擎,通过数字孪生技术,对机器人的 AI 进行虚拟训练,通过传感器模拟学习,然后转化为现实世界的动作 token。黄仁勋高度评价机器人市场的潜力,称它 “很可能是最大的产业。”英伟达宣布推出通用的机器人基础模型 GR00T N1,它是全球首款开源的人形机器人功能模型。黄仁勋透露,英伟达与谷歌的 DeepMind 和迪士尼在合作开发机器人模拟用的开源、可扩展物理引擎,名为 Newton,预计今年晚些时候完成开发。英伟达称,Newton 旨在推动机器人的学习和发展。黄仁勋演讲的现场出现了一部英伟达、谷歌与迪士尼合作研发的机器人,名为 Blue,由英伟达最新的 GR00T N1 模型加持。英伟达称,在研发受《星球大战》电影启发的 BDX 机器人。迪士尼将成为首批使用 Newton 改进其机器人角色平台的公司之一,该平台为下一代娱乐机器人提供动力。黄仁勋表示:“通用机器人时代已经到来。借助英伟达 Isaac GR00T N1 和新的数据生成以及机器人学习框架,世界各地的机器人开发人员将开辟 AI 时代的下一个前沿。”