
NVIDIA's biggest competitor has emerged.

芯片三巨頭鏖戰 AI。
作者 | 周智宇
編輯 | 張曉玲
一週漲價 30%,單片售價超十萬。人工智能的火熱,芯片的短缺,讓英偉達 A800 成了市場上炙手可熱的硬通貨。
趁此東風,英偉達 CEO 黃仁勳一舉成為和馬斯克並肩,最受矚目的企業家之一。英偉達的市值也飆升至 1.17 萬億美元,成了市場上最熱門的科技公司。
然而一面是高端 AI 芯片的稀缺,一面則是 “百模大戰”,下游對算力需求高漲。面對才不過剛剛起勢的市場,大大小小的競爭對手們,都在奮力追趕。它們希望打破眼下 “AI 芯片=英偉達” 的格局,從這個萬億級的市場裏分得一杯羹。
就在 7 月 11 日,英特爾在北京發佈了專供中國市場的 AI 處理器 Gaudi 2,它對標英偉達 100 系列,專為訓練大語言模型而構建。
Gaudi 2 的推出,意味着 AI 芯片市場裏又有一位巨頭下場。在英特爾之前,AMD 也推出了自家的 AI 產品。英偉達、英特爾、AMD 這三家從 PC 時代就鏖戰不止的芯片三巨頭,又在 AI 時代里正面交鋒。
AI 芯片市場裏不會一家獨大,隨着一位位巨頭入場,一場全新的競逐,開始了。
交鋒
藉着推出 Gaudi 2,英特爾向英偉達發起了正面進攻。
PC 市場萎縮以及數據中心業務走軟,讓英特爾業績承壓。原本是服務器芯片市場 “一哥” 的英特爾的市場份額,被 AMD 等競爭對手蠶食。人工智能浪潮帶來對算力的需求,則讓英特爾看到了新的發力點。
Gaudi2 由英特爾 2019 年斥資 20 億美元收購的 AI 初創公司 Habana Labs 設計,從推出的一開始,Gaudi 平台就是為雲端和數據中心提高深度學習訓練效率而構建。
發佈會現場,英特爾公司執行副總裁、數據中心與人工智能事業部總經理 Sandra Rivera 花了大量時間介紹 Gaudi 2 的性能,對比的對象,就是英偉達高端 GPU A100 和 H100。
從演示的數據看,比如説 Bert 模型預訓練,Gaudi 2 的性能是英偉達 A100 的 1.7 倍。至於更先進的英偉達 H100,Habana Labs 的首席運營官 Eitan Medina 表示,Gaudi 2 是目前為能夠替代英偉達 H100 進行 LLM 訓練的 “唯一替代品”。在 MLPerf 3.0 基準測試中,僅有 Gaudi 2 與 H100 能夠進行 GPT-3 訓練。
從目前的數據來説,基於 GPT-3 模型訓練,Gaudi 2 與 H100 尚有一定差距,單個 H100 的性能是 Gaudi 2 的 3.6 倍。不過 Eitan Medina 表示,隨着 9 月英特爾發佈對 FP8 的軟件支持與新功能,Gaudi2 的性價比預計將超越 H100。
性價比,是 Gaudi 2 對抗英偉達 100 系列的一個核心優勢。Eitan Medina 告訴華為見聞,Gaudi2 在運行 ResNet-50 時,每瓦性能約是英偉達 A100 的 2 倍,運行 1760 億參數 BLOOMZ 模型的每瓦性能,則大概是 A100 的 1.6 倍。
也就是説,在提供不錯的性能的同時,Gaudi 2 在能耗上明顯優於英偉達 A100,並且 Gaudi 2 也能從性價比層面挑戰 H100。英特爾也藉此成為目前一眾英偉達的挑戰者中,最具競爭力的對手。
儘管同 A100 類似,Gaudi 2 為了符合美國工業與安全局相關規定,與國際版存在差別。不過 Eitan Medina 表示,中國版 Gaudi 2 在整體性能上與國際版差別不大。明年計劃推出的 5nm Gaudi 3,也會在合規的情況下,提供給中國客户。
目前,英特爾已經與浪潮信息、新華三和超聚變等國內服務器廠商,以及百度智能雲等公司展開合作。浪潮信息副總裁、浪潮 AI&HPC 產品線總經理劉軍也表示,聯合英特爾發佈新一代 AI 服務器 NF5698G7,支持 8 顆 Gaudi2。
此外,Sandra Rivera 透露,到 2025 年的時候,英特爾會把 Gaudi 的 AI 芯片和 GPU 兩條產品線進行整合,屆時會推出一個更完整的下一代 GPU 產品。通過廣泛的產品線,滿足各種不同的需求。
競逐
英特爾不是首家向英偉達發起衝鋒的芯片巨頭。
去年 6 月,AMD 也推出 CPU+GPU 架構的 Instinct MI300,進軍 AI 訓練市場。隨後在今年 6 月,AMD 又通過祭出高達 192 GB HBM 內存的 MI300X,進一步為滿足大模型訓練進行優化。
AMD 的數據中心硬件主管 Forrest Norrod 稱,ChatGPT 引領的 AI 熱潮讓 AMD 也感到意外。業內還是迫切希望英偉達有一個競爭對手,能夠在英偉達的芯片之外,還有一個替代的選項。
事實也是如此。日益增長的大模型訓練需求,與產能受限,讓英偉達充滿了 “幸福的煩惱”。英偉達方面透露,其訂單已經排至 2024 年,像 H100 在明年一季度之前都處於售罄狀態。
前不久的世界人工智能大會(WAIC)上,清華大學電子工程系主任汪玉也強調了目前算力資源的緊張。他表示,部署成本高、模型算力缺口大以及國產芯片生態需要擴張和構建,是目前大模型落地的三大挑戰。
算力需求持續增長,以及大模型玩家渴望通過使用更優秀產品,以減少與 OpenAI 等廠商算力支持差距,都讓市場裏對算力的需求高企。半導體市場裏的玩家也隨之迎來全新的機遇。
Sandra Rivera 表示,在一季度,人工智能帶來的芯片需求,讓英特爾包括 Gaudi 在內的產品需求翻了至少兩倍。此外,在 AI 用例及市場需求爆發式增長的時候,第四代至強處理器也有很好的市場迴響。
按照摩根士丹利的預計,包括英偉達和 AMD 的 GPU、AI 計算專用芯片以及這些芯片的外包生產在內,今年全球 AI 計算半導體市場年銷售規模大概會在 430 億美元。四年內,全球 AI 計算半導體市場銷售額會達到 1250 億美元。這在全球半導體受消費電子銷售放緩,收入下降預期中,是一個增長的亮點。
這個萬億人民幣的市場,也自然吸引了大小玩家,前赴後繼地蜂擁而入。他們相信,市場裏不止有一個英偉達。
英偉達確實有自己的壁壘。GPU 相比 CPU 在並行計算能力、內存帶寬等性能和浮點運算速度上具備明顯優勢,英偉達也藉此在模型訓練和推理上先行一步,領先了 AMD 和英特爾等玩家。英偉達統一計算設計架構 CUDA 也靠着封閉的生態,形成了自己的軟件生態,綁定了百萬計的開發者。
Sandra Rivera 也承認,在目前進行人工智能、AI 運算的時候,很多人都在用 CUDA。然而在她的觀察中,很多大模型的開發者不會做這麼底層的開發,會在 PyTorch、TensorFlow 上做創新。
這也是英特爾等玩家的機遇。Sandra Rivera 認為,軟件開發或者開發者生態一直是英特爾的強項,在數據中心領域,除了 CUDA,就是英特爾的 X86 軟件生態。英特爾則希望為擺脱封閉生態系統,尋求效率與規模的的客户提供更具競爭力的選擇。
除了英偉達、AMD 和英特爾三個芯片巨頭,市場上仍有大玩家摩拳擦掌,準備下場。馬克·扎克伯格旗下的 Meta Platforms 在 7 月 18 日宣佈,將攜手高通,採用高通芯片,以在手機和個人電腦上運行 Meta 新大型語言模型 Llama 2;馬斯克也在 xAI 會議上表示,準備自研 AI 芯片。
在火熱的 “百模大戰” 之外,硬件端的戰役也已打響。傳統芯片巨頭和不斷湧現的新玩家們在 AI 上戰得火熱,如今浪潮初起,一場全新領域裏的王者之爭,方拉開序幕。
