Jensen Huang's NVIDIA GTC keynote speech: This year, four cloud service giants have purchased 3.6 million Blackwell chips

華爾街見聞
2025.03.19 01:33
portai
I'm PortAI, I can summarize articles.

英偉達的黃仁勳在 GTC 大會上宣佈,2024 年四大雲服務巨頭已購買 130 萬 Hopper 芯片,2025 年又將購買 360 萬 Blackwell 芯片。

地時間 3 月 18 日週二,英偉達 CEO 黃仁勳在加州聖何塞舉行的英偉達 AI 盛會 GTC 2025 上發表主題演講。

黃仁勳説,去年的 GTC 大會被譽為 AI 領域的 Woodstock 音樂節,今年 GTC 被稱為 AI 行業的美版春晚 “超級碗”,這兩種稱呼的唯一區別是,在 “超級碗”,每個人都是贏家。

黃仁勳演講覆蓋了 AI 科技演進以及計算需求、即 AI 擴展定律的預測,同時公佈了英偉達的 Blackwell 架構最新一代產品、此後幾代產品的計劃出貨時間,英偉達在機器人領域合作研發的進展。要點包括:

我們將邁向代理式 AI 時代,接着是物理 AI、即機器人時代,AI 擴展定律、即計算需求在超快提速。

去年美國雲服務商四巨頭購買 130 萬塊 Hopper 架構芯片,今年已購 360 萬 Blackwell 芯片,預計 2028 年數據中心資本支出規模突破 1 萬億美元。

通用汽車將用英偉達技術幫助開發自動駕駛汽車,英偉達推出汽車安全 AI 解決方案 Halos;英偉達將與 T-Mobile 等電信公司合作開發用於 6G 的 AI 網絡。

Blackwell 架構全面投產,客户需求 “難以置信”。

推出 “AI 工廠操作系統” Dynamo,Blackwell NVLink72 芯片搭載 Dynamo 的推理性能是 Hopper 的 40 倍;Blackwell 架構新品 Ultra NVL72、即 GB300 預計今年下半年出貨,下一代 Rubin 架構的 Vera Rubin NVLink 144 明年下半年後出貨,之後一代 Rubin Ulta NVL576 將 2027 年下半年出貨。

AI 電腦 DGX Spark 和 DGX Station 採用 Blackwell 芯片。

英偉達推出全球首款人形機器人功能模型 GR00T N1,同 DeepMind 和迪士尼合作開發機器人模擬用開源物理引擎 Newton,GR00T N1 加持的機器人 Blue 和黃仁勳同台亮相,黃稱 “通用機器人時代已到來” 。

黃仁勳重申了他近幾個月來提出的觀點:“AI 算力很容易比我們去年此時認為的要多 100 倍”

將迎來代理式 AI 時代 接下來物理 AI AI 擴展定律超快提速

他首先介紹了 AI 研發的發展歷程,從最初的意識 AI(Perception AI),到現在的生成式 AI(Generative AI),他預計我們將進入代理式 AI(Agentic AI)的時代,接下來將是物理 AI(Physical AI)、也就是機器人的時代。

黃仁勳説,現在我們正在瞭解如何擴展 AI,未來必須關注訓練和擴展構建的 AI 模型。他介紹 AI 的擴展定律(scaling law)發展演化,從預訓練擴展、訓練後擴展到測試時間擴展,即 “長思維”。

黃仁勳認為去年行業對計算需求判斷錯誤。他説:

“計算的需求、即 AI 的擴展定律更具韌性,而且實際上速度在超快提高(hyper-accelerated)。”

英偉達週二當天發佈針對開發者和企業的開源 AI 模型系列,幫助他們打造 Agentic AI 平台,並針對企業發佈 Blackwell Ultra DGX SuperPOD。

四大美國雲服務商今年已購 130 萬 Blackwell 芯片

黃仁勳表示,現在我們 “進行推理所需的計算量比以前大大增加”,而能夠進行的數據和人工訓練是有限的。未來將由人類編寫軟件過渡到由 AI 模型運行軟件

黃仁勳介紹,AI 計算相關的基礎設施增長正處於轉折點。

他透露,2024 年,美國前四大雲服務提供商(CSP)、所謂超大規模雲服務商(hyperscaler)購買了 130 萬塊英偉達的 Hopper 架構芯片,2025 年,又購買了 360 萬 Blackwell 架構芯片。

黃仁勳預計,2028 年,建設數據中心投入的資本支出將超過 1 萬億美元。

黃仁勳展示了英偉達簡化加速平台處理與數據和 AI 等領域採用的 CUDA-X 庫,稱 AI 加速服務於多種行業各行各業都可應用 CUDA-X 庫,稱這只是實現加速計算的庫的一小部分。

黃仁勳預測,每家公司未來都將有兩個工廠,一是用於生產產品,另一個用於 AI 數學。黃仁勳稱,AI 將進入所有行業。

與通用汽車合作開發自動駕駛汽車 與 T-Mobile 等公司合作開發用於 6G 的 AI 網絡

黃仁勳宣佈,英偉達將擴大與通用汽車的合作。通用汽車將運用英偉達的技術幫助開發自動駕駛汽車,用英偉達的技術訓練 AI 製造模型。

英偉達推出了專注於汽車安全的 AI 解決方案,名為英偉達 Halos。黃仁勳説:“我相信,我們是世界上第一家對每一行代碼都進行安全評估的公司。”

黃仁勳還宣佈,英偉達將與思科和 T-Mobile 等公司合作,研究和開發用於下一代無線網絡 6G 的 AI 原生網絡。

Blackwell 架構全面投產 NVLink72+Dynamo 推理性能是 Hopper 的 40 倍

談到數據中心,黃仁勳稱,Blackwell 架構的芯片已經全面投產,“客户需求令人難以置信(incredible)。”

他再次展示了今年 1 月 CES 上他演示的超級芯片 Grace Blackwell NVLink 72。它在一個晶圓上集成了 72 個 Blackwell GPU,並且有 18 個 NVLink Switch,實現 4 位浮點數 FP4 上 1.4 EFLOPS 的計算性能。

英偉達推出號稱未來 “AI 工廠操作系統” 的新開源軟件 Dynamo。它是一個 “分佈式推理服務庫”,基本上是一個開源解決方案,用於解決無法提供足夠用户所需 token 的問題。微軟和 Perplexity 是 Dynamo 的首批合作伙伴。

黃仁勳展示了 Blackwell 架構如何超越 Hopper 超級計算機。用 Grace Blackwell NVLink72 芯片搭載 Dynamo,Blackwell 架構相比 Hopper 架構可將性能提升 25 倍。“在推理模型中,Blackwell 的性能是 Hopper 的 40 倍。”

黃仁勳開玩笑説,Hopper 足以勝任一些任務,而出了 Blackwell,“我是破壞收入的頭子。” 有了 Blackwell 等最新技術加持,搭建 AI 工廠的廠商 “無論如何,你買得越多,就省得越多。”

Blackwell Ultra NVL72 預計今年下半年出貨 下一代 Vera Rubin 一年後出貨

黃仁勳宣佈英偉達芯片新品的消息,Blackwell 系列的新品 Blackwell Ultra NVL72 平台將於今年下半年出貨,它的帶寬是前代 GB200 的兩倍,內存速度是前代的 1.5 倍。Blackwell Ultra 有兩個版本,一是基於 Arm 設計的 CPU,名為 GB300,另一個是名為 B300 的 GPU。

英偉達稱,Blackwell Ultra 平台為 AI 推理時代鋪路。GB300 NVL72 採用機架級設計,連接 72 塊 Blackwell Ultra GPU。相比 Hopper 架構,B300 NVL16 在大語言模型(LLM)上的推理速度提高了 11 倍,計算能力提高了 7 倍,內存增加了 4 倍,可為 AI 推理等最複雜的工作負載提供突破性的性能。

黃仁勳還公佈了 Blackwell 之後下一代 GPU 架構 Rubin AI 數據中心芯片的計劃面世時間。

英偉達預計,名為 Vera Rubin 的平台將於 2026 年下半年開始出貨,它得到 NVLink 144 技術加持,包括名為 Vera 的英偉達首款定製 CPU 設計和名為 Rubin 的 GPU 設計。Vera Rubin NVLink 144 的性能將是 GB300 NVL 72 的 3.3 倍。

相比三年前英偉達在 GTC 大會首次發佈的前代 Grace CPU,Vera 芯片的性能提高一倍。Vera 基於 Olympus 核心設計,Vera 設計的速度將是去年採用 Blackwell 架構 CPU 的兩倍。

Rubin 在進行推理時可以達到每秒 50 千萬億次浮點運算(petaflops)的速度,比當前 Blackwell 芯片每秒 20 petaflops 的速度高出一倍多。Rubin 還可以支持高達 288 GB 的快速內存。Rubin 實際上是兩塊 GPU,從 Rubin 開始,英偉達會將兩個或多個芯片組合成一個芯片,將它們成為一個單獨的 GPU。

Vera Rubin 之後,英偉達預計,下一代 Rubin Ultra NVL576 將於 2027 年下半年推出,其性能將是 GB 300 NVL72 的 14 倍。

黃仁勳稱,Rubin 之後的下一代架構名為 Feynman,名門來自著名物理學家理查德・費曼,該架構將於 2028 年亮相。

AI 電腦 DGX Spark 和 DGX Station 採用 Blackwell 芯片

黃仁勳宣佈英偉達週二發佈兩款 AI 電腦,分別名為 DGX Spark 和 DGX Station,稱它們是 “AI 時代的計算機”。

這兩款電腦都使用 Blackwell 架構的芯片。DGX Spark 採用 GB10 Grace Blackwell 超級芯片,外形類似 Mac-Mini。DGX Station 體積更大,由 GB300 Grace Blackwell Ultra Desktop 芯片驅動。

DGX Spark 本週二開始接受預訂,將在未來幾個月內上市。DGX Station 將在今年晚些時候由華碩、戴爾、惠普等英偉達的合作伙伴發售。

合作開發機器人模擬用開源物理引擎 Newton GR00T N1 模型加持的機器人 Blue 和黃仁勳同台

英偉達播放了一段視頻,展示如何進行機器人研究。包括使用 Omniverse 平台 和 Cosmos 仿真引擎,通過數字孿生技術,對機器人的 AI 進行虛擬訓練,通過傳感器模擬學習,然後轉化為現實世界的動作 token。

黃仁勳高度評價機器人市場的潛力,稱它 “很可能是最大的產業。”

英偉達宣佈推出通用的機器人基礎模型 GR00T N1,它是全球首款開源的人形機器人功能模型。

黃仁勳透露,英偉達與谷歌的 DeepMind 和迪士尼在合作開發機器人模擬用的開源、可擴展物理引擎,名為 Newton,預計今年晚些時候完成開發。英偉達稱,Newton 旨在推動機器人的學習和發展。

黃仁勳演講的現場出現了一部英偉達、谷歌與迪士尼合作研發的機器人,名為 Blue,由英偉達最新的 GR00T N1 模型加持。

英偉達稱,在研發受《星球大戰》電影啓發的 BDX 機器人。迪士尼將成為首批使用 Newton 改進其機器人角色平台的公司之一,該平台為下一代娛樂機器人提供動力。

黃仁勳表示:

“通用機器人時代已經到來。藉助英偉達 Isaac GR00T N1 和新的數據生成以及機器人學習框架,世界各地的機器人開發人員將開闢 AI 時代的下一個前沿。”