
Dell Technologies is rumored to release the NVIDIA B200 next year, with a power consumption of up to 1000W. The ultimate benefit for AI is: energy?

馬斯克:美國現在芯片短缺,一年後會出現變壓器短缺,大約兩年內就會出現電力短缺。
作者:李笑寅
來源:硬 AI
“芯片荒” 之後,人工智能市場還將面臨 “電力荒”?
受益於 AI 服務器需求激增,全球最大的服務器製造商之一戴爾最新財季實現了超預期的營收,股價在過去 12 個月的時間裏上漲了一倍多。
財報發佈後,戴爾公司的首席運營官 Jeff Clarke 在新聞稿中透露:英偉達將於 2025 年推出載有 “Blackwell” 架構的 B200 產品,功耗或將達到 1000W。
Clarke 還表示,戴爾的旗艦產品 PowerEdge XE9680 機架服務器採用了英偉達 GPU,是該公司歷史上 “速度最快” 的解決方案。
B200 功耗較 H100 增加 40% 以上
目前,英偉達尚未透露 Blackwell 架構的詳細信息,如果從芯片製造的角度、參考散熱的基本經驗法則(每 mm²芯片面積最高散熱量為 1W)來看:
英偉達的 H100(基於定製 4nm 級工藝技術構建)的功耗約為 700W(包含 HBM 內存功率在內),並且考慮到芯片裸片的面積大小為 814mm²,因此每平方毫米的功耗實際是低於 1W 的。這就相當於,B200 的功耗將較 H100 增加 40% 以上。
有媒體機構分析指出,H200 很可能會基於另一種性能增強的工藝技術構建,比如採用 3nm 級的工藝技術構建。
並且考慮到芯片消耗的功率以及所需的散熱量,B100 可能會成為該公司的第一個雙芯片設計生產的 GPU,從而使其具有更大的表面積來散熱。據悉,AMD 和英特爾採用了具有多芯片設計的 GPU 架構,或將成為一種行業趨勢。
除了能耗對芯片設計提出要求外,談及 AI 和高性能計算(HPC)應用,還需要考慮到如何平衡這些 FLOPS 所需的高功率和同時釋放的熱能。
FLOPS(floating-point operations per second)是指每秒浮點運算次數,一般用來衡量硬件的性能。
對於軟件開發人員來説,重要的是如何高效地使用這些 FLOPS;而對於硬件開發人員來説,重要的是如何冷卻產生這些 FLOPS 的處理器。
而這正是戴爾 Blackwell 處理器的優勢所在。
Clarke 表示:
“(英偉達下一代 AI 及 HPC GPU)將在明年的 B200 上實現。”
“我們將有機會展示我們的工程技術和我們的行動速度,以及我們作為行業領導者所做的工作,將我們的專業技術用於實現液冷的規模化性能,無論是流體化學和性能方面的工作,還是我們的互連工作、我們正在做的遙測工作、我們正在做的電源管理工作。這確實讓我們做好了準備,將其大規模推向市場,以利用市場上將存在的這種令人難以置信的計算能力或強度或能力。”
B200 並未出現在英偉達去年 10 月份發佈的技術路線圖中。目前,英偉達也還尚未公佈 B100 的詳細信息,不過可能會在本月晚些時候即將舉行的開發者大會上釋出相關細節。
AI 終極利好的是——能源?
隨着人工智能技術發展,市場眼下對芯片的需求激增,但這之後還將面臨着電力需求的激增。
從行業來看,人工智能領域的蓬勃幾乎重塑了本就炙手可熱的數據中心市場。有相關數據顯示,十年前全球數據中心市場的耗電量為 100 億瓦,而如今 1000 億瓦的水平已十分常見。
儘管目前人工智能僅佔全球數據中心規模的一小部分。但根據美國 Uptime Institute 的預測,到 2025 年,人工智能業務在全球數據中心用電量中的佔比將從 2% 猛增到 10%。
有策略師分析表示,AI 技術發展利好能源股:
“越來越多的人開始意識到,大型人工智能服務器羣將需要大量能源,這正在提高一些投資者的興趣,開始將投資範圍擴大至電力、油氣在內的相關能源領域,核能也開始受到關注。”
馬斯克此前也表現對出能源前景的擔憂。去年年底他在一檔播客節目中表示,美國現在有芯片短缺,一年後會出現變壓器短缺,大約兩年內就會出現電力短缺。
有媒體報道稱,美國目前的變壓器需求主要靠進口補足。隨着向更清潔電力系統轉型,電網不斷擴容,對變壓器的需求將激增,如果不採取進一步行動,到 2030 年美國將面臨一道難以逾越的國內供應缺口。
