
TrendForce: NVIDIA Blackwell's high energy consumption drives demand for heat dissipation, with an estimated liquid cooling penetration rate reaching 10% by the end of 2024

英偉達計劃在 2024 年底推出新一代平台 Blackwell,並建置 AI Server 數據中心,預計將推動液冷散熱方案滲透率達 10%。Blackwell 平台將取代既有的 Hopper 平台成為 NVIDIA 高端 GPU 主力方案,佔整體高端產品近 83%。在追求高效能的 AI Server 機種中,單顆 GPU 功耗可達 1,000W 以上,這將促進 AI Server 散熱液冷供應鏈的成長。根據 TrendForce 集邦諮詢,服務器芯片的熱設計功耗持續提高,傳統氣冷散熱方案不足以滿足需求。
智通財經 APP 獲悉,7 月 30 日,TrendForce 集邦諮詢發文稱,隨着高速運算的需求成長,更有效的 AI Server(AI 服務器)散熱方案也受到重視。根據 TrendForce 集邦諮詢最新 AI Server 報告,由於英偉達 (NVDA.US) 將在 2024 年底前推出新一代平台 Blackwell,屆時大型 CSP(雲端服務業者)也會開始建置 Blackwell 新平台的 AI Server 數據中心,預估有機會帶動液冷散熱方案滲透率達 10%。
氣冷、液冷並行方案滿足更高散熱需求
根據 TrendForce 集邦諮詢調查,NVIDIA Blackwell 平台將於 2025 年正式放量,取代既有的 Hopper 平台,成為 NVIDIA 高端 GPU(圖形處理器)主力方案,佔整體高端產品近 83%。在 B200 和 GB200 等追求高效能的 AI Server 機種,單顆 GPU 功耗可達 1,000W 以上。HGX 機種每台裝載 8 顆 GPU,NVL 機種每櫃達 36 顆或 72 顆 GPU,可觀的能耗將促進 AI Server 散熱液冷供應鏈的成長。
TrendForce 集邦諮詢表示,服務器芯片的熱設計功耗 (Thermal Design Power, TDP) 持續提高,如 B200 芯片的 TDP 將達 1,000W,傳統氣冷散熱方案不足以滿足需求;GB200 NVL36 及 NVL72 整機櫃的 TDP 甚至將高達 70kW 及近 140kW,需要搭配液冷方案方以有效解決散熱問題。

據 TrendForce 集邦諮詢瞭解, GB200 NVL36 架構初期將以氣冷、液冷並行方案為主;NVL72 因有更高散熱能力需求,原則上優先使用液冷方案。
觀察現行 GB200 機櫃系統液冷散熱供應鏈,主要可分水冷板(Cold Plate)、冷卻分配系統(Coolant Distribution Unit, CDU)、分歧管(Manifold)、快接頭(Quick Disconnect, QD) 和風扇背門(Rear Door Heat Exchanger, RDHx) 等五大零部件。
TrendForce 集邦諮詢指出,CDU 為其中的關鍵系統,負責調節冷卻劑的流量至整個系統,確保機櫃温度控制在預設的 TDP 範圍內。TrendForce 集邦諮詢觀察,目前針對 NVIDIA AI 方案,以 Vertiv(維諦技術)為主力 CDU 供應商,奇鋐、雙鴻、台達電和 CoolIT 等持續測試驗證中。
2025 年 GB200 出貨量估可達 6 萬櫃,促 Blackwell 平台成市場主流、將佔 NVIDIA 高端 GPU 逾 8 成
根據 TrendForce 集邦諮詢觀察,2025 年 NVIDIA 將以 HGX、GB200 Rack 及 MGX 等多元組態 AI Server,分攻 CSPs 及企業型客户,預估這三個機種的出貨比例約為 5:4:1。HGX 平台可較無縫對接現有 Hopper 平台設計,使 CSPs 或大型企業客户能迅速採用。GB200 整櫃 AI Sever 方案將以超大型 CSPs 為主打,TrendForce 集邦諮詢預期 NVIDIA 將於 2024 年底先導入 NVL36 組態,以便快速進入市場。NVL72 因其 AI Server 整體設計及散熱系統較為複雜,預計將於 2025 年推出。
TrendForce 集邦諮詢表示,在 NVIDIA 大力擴展 CSPs 客羣的情況下,預估 2025 年 GB200 折算 NVL36 合計出貨數量可望達 6 萬櫃,而 GB200 的 Blackwell GPU 用量可望達 210-220 萬顆。
然而,終端客户採用 GB200 Rack 的過程仍有幾項變量。TrendForce 集邦諮詢指出,NVL72 需較完善的液冷散熱方案,難度較高。而液冷機櫃設計較適合新建數據中心,但會牽涉土地建物規劃等複雜程序。此外,CSPs 可能不希望被單一供應商綁住規格,可能會選擇 HGX 或 MGX 等搭載 x86 CPU 架構的機種,或擴大自研 ASIC(專用集成電路)AI Server 基礎設施,以應對更低成本或特定 AI 應用場景。
