被廣泛視為第四次工業革命的 AIGC 浪潮,正在給人類的生產方式帶來顛覆性的變革。憑藉堪比黃金緊俏的 GPU,英偉達榮膺 AI“賣水人”,年內股價大漲 240%。 然而,多方搶購之下,英偉達 GPU 已經陷入產能瓶頸。最新的 H100 芯片早已全部賣空,現在下單要等 2024 年 Q1 甚至 Q2 才能用上。 根源在於,GPU 零部件產能嚴重不足,繼而影響供應。 以 H100 芯片為例,其最關鍵的零部件主要是:1)邏輯芯片;2)HBM 存儲芯片;3)CoWoS 封裝。 核心的邏輯芯片尺寸為 814 平方毫米,主要由台積電最先進的台南 18 號工廠供應,使用的工藝節點則是 “4N”,實際是 5nm+。由於 PC、智能手機和非 AI 相關數據中心芯片市場疲軟,目前台積電 5nm+ 產能利用率不到 70%。因此邏輯芯片供應沒有問題。 在 H100 最中心的邏輯芯片旁邊,是 6 塊 HBM(High Bandwidth Memory),它一種基於 3D 堆疊工藝的 DRAM 內存芯片,像摩天大廈中的樓層一樣可以垂直堆疊,將多個 DDR 芯片堆疊在一起,通過硅通孔(TSV)連接,並使用 TCB 鍵合,實現更高帶寬、更高位寬、更低功耗、更小尺寸。 內存芯片對 GPU 性能至關重要,尤其是訓練 AI 所用的高性能 GPU。推理和訓練工作負載是內存密集型任務。隨着 AI 模型中參數數量的指數級增長,僅權重一項就將模型大小推高到了 TB 級。因此,從內存中存儲和檢索訓練和推理數據的能力決定了 GPU 性能的上限。 作為 HBM 的先驅,HBM 供應幾乎由韓國內存芯片廠商 SK 海力士一家壟斷,市佔率超過 95%,也是唯一有能力生產 H100 各型號上所使用的 HBM3 的廠商。 HBM3 供應目前也相當緊俏,此前有媒體報道稱,英偉達和 AMD 要求 SK 海力士提供尚未量產的下一代 HBM3E 芯片的樣品。英偉達已要求 SK 海力士儘快供應 HBM3E,並願意支付 “溢價”。 不過,隨着存儲芯片大廠紛紛投入重金提升 HBM3 產能,供應緊張的狀況或在今年有所緩解。近期有媒體報道稱,在通過最終質量測試後,三星電子 8 月 31 日與英偉達簽署了協議,將向後者供應 HBM3。最早將於下週開始供應。 早些時候,花旗亦在報告中透露,三星將在四季度開始向英偉達供應 HBM3。 另一大產能瓶頸,在於 CoWoS 封裝。 HBM 和 CoWoS 封裝兩種技術相輔相成。HBM 對焊盤數量和短線跡長度的要求很高,這就需要 CoWoS 先進封裝技術來實現 PCB 甚至封裝基板上無法實現的高密度、短連接。 目前,幾乎所有的 HBM 都採用 CoWoS 封裝技術。英偉達 GPU CoWoS 封裝的主力供應商是台積電。但由於需求爆炸式增長,台積電產線即便開足馬力也難以填補供需鴻溝。為此,台積電已經新開竹南、龍潭和台中三座工廠,其中竹南工廠佔地 14.3 公頃,比其他封裝廠的總和還要大。 有市場分析認為,台積電正積極加碼先進封裝產能,以滿足市場對其先進封裝解決方案的更多需求。 另外,英偉達首席財務官 Colette Kress 近期透露,英偉達在 CoWoS 封裝等關鍵製程已開發並認證其他供應商產能,預期未來數季供應可逐步攀升,英偉達持續與供應商合作增加產能。