賽道 Hyper | 誰能阻擋 AI GPU 霸主英偉達的腳步

天下英雄誰敵手？

儘管英偉達僅在 5 月 30 日盤中突破萬億美元市值，短暫進入高光時刻便再次跌回萬億美元以下市值，但由 ChatGPT 引發的 “英偉達” 旋風，在 AI 業界卻越刮越猛。

6 月 1 日，多個獨立信源告訴華爾街見聞，英偉達 CEO 黃仁勳將於 6 月 5 日至 6 月 11 日期間抵達中國大陸。但英偉達沒有向華爾街見聞正面確認此則消息。

眼下，A 股但凡和 “英偉達” 或 “黃仁勳” 三字沾邊，個股都受到市場熱捧。5 月 29 日，黃仁勳在參加 COMPUTEX 2023 中國台北國際電腦展會時，演示英偉達新平台 Isaac AMR（自主移動機器人）。這個平台的底盤採用了科創板公司的 RMP 系列產品，該公司盤中立即漲停。

在 “超級 AI 應用” ChatGPT 的指引下，英偉達第二季度營收預測值超出市場預期竟高達驚人的 50%，至 110 億美元。

誰還能阻擋英偉達稱霸 AI 賽道？

英偉達的 AI GPU 強在何處？

英特爾已不再是當年那家佔據統治地位的科技公司。

原本 CPU 是 PC 或服務器最重要的核心部件。但是現在，加速計算芯片通過殺手級應用 ChatGPT 正在加速取代 CPU 的地位。算力成為以 IDC 為基礎條件的 AI 應用發展核心驅動力，GPU 成為關鍵部件。

“生成式人工智能將是（英偉達業績）引爆點。” 黃仁勳説，“與 CPU 相比，未來 IDC 更需要 GPU，因為數據都將通過生成式 LLM 自動生成，而非主要用於數據檢索。” 生成數據需要更多的 GPU，而檢索數據，只需要 CPU。

目前，性能愈發強悍的 PC 系統配置了超過 8 個服務器 GPU 和 1 個 CPU 的算力硬件，英偉達佔據了全球超過八成（84%）的服務器（IDC：數據中心）GPU 市場份額。

比如，英偉達 DGX 系統，這是用於數據訓練的 IDC 核心算力來源，搭載了 8 顆英偉達高端 H100 GPU，還有兩顆 CPU；谷歌的 A3 超級計算機，同樣用了 8 顆英偉達 H100 GPU，但只用了 1 顆英特爾製造的高端至強處理器。

據英偉達公示的技術資料顯示，H100 於 2022 年三季度發佈，訓練速度比 A100 快 9 倍，推理速度比上代產品 A100 快 30 倍。5 月 29 日，黃仁勳發佈了 GH200 超級芯片，這是英偉達開發的基於 Arm 架構的 CPU+GPU 集成方案，用於開發聊天機器人、互聯網推薦系統算法等大模型 AI 應用。

這個趨勢隨着 AGI 在產業的持續落地，產生的影響日益顯著。英偉達 IDC 業務在第一季度增長了 14%，但英特爾的 AI 和 IDC 業務部門業績下降了 39%。

另一項因素也在加強英偉達超越英特爾的優勢。英偉達服務器 GPU 售價極高，單顆英偉達 H100 售價高達 4 萬美元（eBay 平台加急售價），而英特爾最新一代至強 CPU 的單顆標價雖然也很高，但 “只有” 1.7 萬美元。

當然英偉達也不是全無對手，當年英特爾的上游合作伙伴 AMD，也在發力服務器 GPU，包括高通、蘋果、谷歌和亞馬遜在內的眾多巨頭，都在設計開發移動 AI 算力芯片，而非服務器 GPU；甚至是英特爾，在遊戲領域的 GPU 技術實力，同樣不容小覷。

但是在眼下，英偉達確實一家獨大。但凡提及 AGI 算力，無不將英偉達服務器 GPU 列為首選。這主要是因為 AGI 目前對算力極為渴求，要處理處理 TB 級數據，訓練性能要求極高，而在需要 “推理” 的過程中使用模型生成文本、圖像或預測，也不是移動 AI GPU 能達成的。

更重要的還不在於英偉達的 GPU 硬件性能，而是——英偉達的 AI 軟件系統：英偉達的 AI 專有軟件，能輕鬆聚合 GPU 的硬件功能用於 AI 應用程序。

黃仁勳在英偉達財報電話會議上也説，“我們的軟件不易複製，（競對）必須設計所有的軟件、庫和算法，將它們集成到框架中並做持續優化；同時，軟件架構也同樣需要優化迭代。”

也就是説，要做到和英偉達一樣，實現 GPU 與 AI 應用的無縫銜接，要做的不僅僅是優化芯片的設計和性能，還需要對軟硬件的技術架構和整體框架做同步優化，這是一項系統工程。要超越單品性能雖然不易，但並非全無可能，但面對系統級能力，談超越，難度不言而喻。

英偉達也在持續增加對 IDC 的資本投入。據英偉達最新財報顯示，其整體收入中，IDC 資本支出的份額佔比已增至 8.4%，而之前根據其上一年的固定比率預測為 6.5%。

初創公司和巨頭的現實威脅

看上去似乎無人能阻擋英偉達在 AI 技術領域的統治地位，但 AI 前景的無限空間，仍在吸引無數挑戰者。

除了上文提及的多家巨頭，初創 AI 公司成為英偉達 AI 挑戰者大軍不容忽視的一部分。當然，這種技術要求的初創公司很難出自無名之輩。

有一則極具戲劇性的傳聞，出自在前沿技術和應用領域極為活躍的特斯拉公司首席執行官埃隆·馬斯克（Elon Musk）之口。這位持續讓世人驚歎的科技鉅子説，“就連狗都在搶 GPU”。

有鑑於此，所以馬斯克雖然在口頭上叫停研究 AI 技術，但他的身體卻很誠實：這位老兄在今年 3 月 9 日建立了一家取名為 “X.AI” 的 AI 公司，還偷偷摸摸買了 10000 顆英偉達 GPU。

想分英偉達一杯羹的還有來自英特爾公司架構、圖形和軟件（IAGS）部門的副總裁、首席架構師 Raja Koduri，這位技術大拿已於今年 3 月底離職。接下來，Raja Koduri 將創辦一家 AI 技術公司，主要研發新一代生成式 AI 工具，目的是削弱英偉達對數字電影和視頻遊戲市場的控制力。

與馬斯克的 X.AI 公司不知道要幹嘛相比，Raja Koduri 的計劃更清晰。他這家尚未命名的 AI 初創公司，第一個項目，是要創建一套 AI 工具，以便讓包括電影和遊戲藝術家在內的消費羣體，無論用 PC、Mac、iPad 還是其他設備，都無需深入研究軟件代碼而直接生成自己想要的工作結果。

儘管這些 AI 賽道新手看上去很想大幹一場，但真正對英偉達有現實挑戰能力的還是 AMD、微軟和谷歌此類巨頭。其中，AMD 在遊戲領域的 GPU 對英偉達有些許威脅，但 IDC 需要的服務器專用 GPU 性能無法望其項背。

至於微軟、谷歌甚至雲服務商比如亞馬遜，都一面和英偉達保持良好的業務合作，一面又在下大本錢研發自己的 AI 專用 GPU。

比如微軟，這個桌面 PC 時代的超級霸主，正是 OpenAI 的背後金主（2019 年微軟給 OpenAI 投了 10 億美元），同時也是英偉達 H100 芯片最大的採購方。今年 3 月，微軟用數萬顆英偉達 GPU 幫 OpenAI 組裝了一台 AI 超級計算機。

但微軟也在推進自己的 AI 芯片研發計劃，代號 “雅典娜”。這項計劃始於 2019 年，目標是為訓練 LLM（大語言模型）等軟件而設計，同時可支持推理，能為 ChatGPT 背後的所有 AI 軟件提供算力支持，初代雅典娜 GPU 量產時間表被定於 2024 年。

與微軟相比，谷歌對英偉達的威脅可能更顯著。目前谷歌的 AI 處理芯片是專為 AI 研究開發機器學習（Machine Learning）的專屬芯片 TPU（張量處理單元），能同時處理 “雲上” 訓練和推理，並設計了基準測試工具 MLPerf。

谷歌 TPU 如今已迭代到 V4 版。據谷歌 4 月 6 日披露，得益於互連技術和領域特定加速器（DSA）方面的關鍵創新，谷歌雲 TPU v4 在擴展機器學習系統性能方面比其前代版本有了近 10 倍的飛躍。

TPU v4 是谷歌於 2021 年推出的、專門用於執行機器學習的 AI 芯片，是谷歌第 5 代特殊領域加速器（DSA：Domain Specific Accelerator）及第 3 代用於 ML 模型的超級計算機平台，其性能與英偉達 A100 相比，速度快 1.2-1.7 倍，功耗低 1.3-1.9 倍。

儘管如此，就眼下看，對英偉達具有商業層面現實威脅的公司，還不存在。這些威脅，現在還處於水面之下。