英偉達眼裏的競爭對手

華爾街見聞
2024.03.15 06:49

英偉達股價飆升,成為美股第三大上市公司,CEO 黃仁勳個人財富達到近 700 億美元。然而,英偉達面臨競爭對手的挑戰,包括 AMD、英特爾、華為、博通、高通、亞馬遜和微軟等公司。英偉達在最新財報中列出了競爭對手,包括設計 GPU 的公司、定製芯片和加速計算解決方案供應商、大型互聯網服務公司、SoC 產品供應商和互連、交換和電纜解決方案供應商。這些競爭對手讓英偉達產生危機感。

英偉達的股價又一次飆上了高點。

在英偉達發佈 2024 財年第四季度財報後,這家驅動 AI 發展的公司攀上了一個新的高峰:股價一路升至近 800 美元,總市值近 2 萬美元,超越谷歌和亞馬遜,成為美股的第三大上市公司。

而 CEO 黃仁勳的個人財富也隨之飆升,憑藉着 3.5% 的英偉達股份,他的總資產來到了近 700 億美元,躋身全球富豪榜前二十。

如今,受到資本熱捧的英偉達儼然一副半導體一哥的形象,即使是排在它前面的微軟和蘋果,在人工智能的發展上也需要向它取取經,順便買點 H100 來訓練一下自己的大模型。

但是,坐擁 AI 市場的英偉達真的天下無敵了嗎?它的對手在哪裏?

在英偉達的最新財報中,它將自己的競爭對手一一列出,一共分為了四大類,分別是設計分立和集成 GPU、定製芯片和其他加速計算解決方案的供應商和許可商、擁有內部團隊設計芯片的大型互聯網服務公司、嵌入到汽車、自動機器和遊戲設備中的 SoC 產品供應商、以及互連、交換和電纜解決方案供應商。

這其中既有大家熟悉的老面孔,也有近幾年隨着英偉達業務擴張而加進來的新面孔,大家不妨來看下其中的佼佼者,它們是如何讓 2 萬億美元的公司在 AI 上產生危機感的。

英偉達的老對手

英偉達從來就不缺少挑戰者。

從上世紀末開始到如今,圖形處理器的作用愈來愈重要,而在該行業中的佼佼者、定義了 GPU 這一名稱的英偉達,自然少不了與其他廠商展開競爭,早期的 3DFX,後來的 ATi,都給英偉達帶來過不小的壓力。

而隨着圖形市場大浪淘沙,這部分廠商的數量迅速縮減,英偉達逐步確立了自己在 GPU 行業的地位,在 2006 年 ATI 被收購之後,還能對英偉達霸主地位造成威脅的,首先就是兩個大家熟悉的老朋友——AMD 與英特爾。

單論在 GPU 方面的技術積累,成立時間較長、併購企業較多的 AMD 和英特爾,顯然是有自己一份底氣在的,事實上,這兩家也確實在英偉達顯卡大賣的時候,與它展開了一輪 AI 競賽,紛紛掏出了自己對標 H100 和 A100 的得意之作。

AMD 早在 2022 年 6 月,就推出 CPU+GPU 架構的 Instinct MI300,正式進軍 AI 訓練端。而在去年 6 月,又公佈了 MI300X 與 MI300A 兩款 AI 加速器, 其中 MI300X 採用了 8 XCD,4 個 IO die,8 個 HBM3 堆棧,高達 256MB 的 AMD Infinity Cache 和 3.5D 封裝的設計,支持 FP8 和稀疏性等新數學格式,是一款全部面向 AI 和 HPC 工作負載的設計,而它的晶體管也達到了 1530 億顆,成為了 AMD 迄今為止製造的最大芯片。

AMD 表示,MI300X 在人工智能推理工作負載中的性能比英偉達 H100 高出 1.6 倍,在訓練工作中的性能與 H100 相當,從而為業界提供了亟需的高性能替代品,以取代英偉達的 GPU。此外,這些加速器的 HBM3 內存容量也是英偉達 GPU 的兩倍多,達到驚人的 192 GB,使其 MI300X 平台能夠支持每個系統兩倍多的 LLM,並能運行比 H100 HGX 更大的模型。

而在去年 12 月的 “Advancing AI” 活動中,AMD 為旗艦 AI GPU 加速器 MI300X 專程開了一場發佈會,同時推出了配套的 ROCm 6.0 開放軟件平台,其指出與上一代軟硬件組合相比,使用 MI300X 和 ROCm 6 跑 Llama 2 70B 文本生成,AI 推理速度提高了約 8 倍。

英特爾在 AI 上的步伐也從未停止過,它瞄準生成式 AI 市場的主要產品就是 Gaudi。為了進軍深度學習市場,早在 2016 年 8 月,英特爾就花費 4 億美元收購了 Nervana Systems,被英特爾收購後,Habana 一共發佈了 2 款 AI 芯片,分別是 Gaudi 和 Gaudi 2。Gaudi 平台從一開始就為數據中心的深度學習訓練和推理工作負載而構建的 AI 加速器。其中 Gaudi 2 於 2022 年推出,相比第一代,Gaudi 2 在性能和內存方面的提升,使其成為市場上能夠橫向擴展 AI 訓練的一大解決方案。

英特爾還特意為受限中國市場推出了專為訓練大語言模型而構建的最新 Gaudi 2 新產品——HL-225B 夾層卡。HL-225B 處理器符合美國工業與安全局發佈的有關出口規定,Gaudi2 夾層卡符合 OCP OAM 1.1 規範。這樣一來,客户便可從符合規範的多種產品中做出選擇,靈活地進行系統設計。

值得一提的是,英特爾在去年年底還首次展示了用於深度學習和大規模生成人工智能模型的 Gaudi3 系列 AI 加速器,預計將於 2024 年上市。據爆料,英特爾 Gaudi 3 將採用 5nm 工藝,帶寬是前代 Gaudi 2(7nm 工藝)的 1.5 倍,BF16 功率是其 4 倍,網絡算力是其 2 倍。

2023 年底,生成式人工智能的世界裏上演了一場芯片版的《黃金三鏢客》,身披綠色、紅色和藍色披風的牛仔,屏住呼吸,把手放在了自己的槍套上,只待最後幾秒的來臨,宣佈自己的人工智能解決方案。

隨着老對手的不斷追趕,即使是這兩年順風順水的英偉達,也感受到了一點壓力,華爾街日報最近的一篇文章揭露了部分廠商對英偉達的指控,他們稱英偉達傾向於推遲向考慮採用競爭對手人工智能處理器的客户交付 GPU,這種情況讓英偉達客户噤若寒蟬,有些客户甚至隱瞞和否認與競爭對手的互動。

英偉達的新對手

英偉達擔憂的,也不只是兩位老對手。

近日,英偉達在向美國證券交易委員會提交的文件中,首次將華為認定為人工智能芯片等多個類別的最大競爭對手,英偉達提到的其他競爭對手包括英特爾、AMD、博通和高通,此外還列出了許多重要的雲計算公司,例如亞馬遜和微軟。

英偉達在文件中表示,華為在供應人工智能芯片方面存在競爭,例如圖形處理單元(GPU)、中央處理單元(CPU)和網絡芯片,其認為,華為還是一家雲服務公司,能夠設計自己的硬件和軟件以改進人工智能計算。

值得一提的是,華為在去年 8 月正式發佈了 “昇騰 910” AI 芯片及 “MindSpore” 全場景 AI 計算框架。華為公司輪值董事長徐直軍在接受媒體採訪時提到,昇騰不以獨立芯片面向市場,而是以融合入板卡服務器以及雲服務的方式推出,AI 芯片作為獨立業務面向市場的情況不會發生也不會實現。

除了華為這樣的中國廠商外,博通和高通也成為了英偉達所顧慮的對手之一。

博通一直被許多人所忽略,但它也在人工智能領域發掘到了自己的金礦。根據 2020 年摩根大通分析師哈蘭·蘇爾的報告,谷歌 TPU v1 至 v4 這幾代均是由博通共同設計的,當時它已經開始生產採用 7nm 工藝的 TPU v4,並開始與谷歌合作設計採用 5nm 工藝的 TPU v5

蘇爾表示,博通的專用集成電路(ASIC)業務 2020 全年收入為 7.5 億美元,高於 2016 年的 5000 萬美元,除了芯片設計之外,博通還為谷歌提供了關鍵的知識產權,並負責了製造、測試和封裝新芯片等步驟,以供應谷歌的新數據中心,博通還與其他客户如 Facebook、微軟和 AT&T 等公司合作設計 ASIC 芯片。

就收入而言,博通是全球第二大人工智能芯片公司,僅次於英偉達,其 ASIC 的銷售額達數十億美元,背後正是谷歌加大 TPU 部署的結果,光是一家谷歌的 TPU 就讓博通的 ASIC 收入翻了兩番還多,倘若其他廠商向博通拋來橄欖枝,那麼此消彼長,英偉達 AI 顯卡的訂單就會減少,這也是它被列入英偉達名單的原因。

至於 “雙通” 的另一位,也就是高通,大家可能以為它與英偉達的競爭體現在車載芯片市場中,但除了 8195 和 8295 這樣的智能座艙芯片外,高通還從另一個領域向英偉達發起了進攻。

去年 11 月,高通發佈了 Cloud AI 100 Ultra,其屬於雲 AI 推理加速卡,專為生成式 AI 和大型語言模型而設計。據高通介紹, Cloud AI 100 Ultra 是一個可編程的 AI 加速器,可以支持最新的 AI 技術和數據格式,其利用高通 AI 堆棧,可以使客户能夠 “在任何地方訓練並在 Cloud AI 100 Ultra 上進行推理”,從而支持模型的移植和優化。

事實上,高通早在 2020 年就推出了 Cloud AI 100 推理加速卡,2023 年 9 月,MLCommons 發佈了 MLPerf Inference 3.1 基準測試結果,其中高通展示了其 Cloud AI 100 推理加速器的顯着進步。結果顯示, Cloud AI 100 的性能、能效和延遲顯着提升,尤其是自然語言處理 (NLP) 和計算機視覺網絡,其在基準測試超越了之前的記錄。在多個類別中,Cloud AI 100 在峯值離線性能、能效和延遲減少方面都取得了進步。

高通新推出的 Cloud AI 100 Ultra 在原來的基礎上進一步加強,明確針對生成式 AI 和大型語言模型的需求,而且高通也着重提到了運營成本這回事,其表示,在雲和企業用例中,與競爭對手相比,高通 Cloud AI 100 Ultra 在生成式 AI(包括 LLMs、NLP 和計算機視覺工作負載)方面每 TCO 美元提供兩到五倍的性能。

當然,高通與其他廠商不同的是,它能夠將 Cloud AI 100 產品所代表的高性能、高能效推理與能夠滿足邊緣市場更廣泛需求的 IP 產品組合相結合,這在當前的技術提供商中很少見,也是它相較於英偉達的獨特優勢。

上面的三位還都是提供產品和解決方案的,更讓英偉達感到頭疼的,還是微軟與亞馬遜這樣的雲計算客户,身為客户,他們為英偉達帶來滾滾不斷的現金財富,但背地裏,它們卻暗自針對英偉達,避免它一家獨大的情況,這種既是金主又是對手的身份,讓英偉達左右為難。

微軟在 2023 年 11 月的 Microsoft Ignite 大會上,推出了兩款定製設計的芯片和集成系統:針對人工智能 (AI) 任務和生成式 AI 進行優化的 Microsoft Azure Maia AI 加速器,以及 Microsoft Azure Cobalt CPU——一款基於 Arm 的處理器,專為在 Microsoft 雲上運行通用計算工作負載而設計。

微軟方面表示,這些芯片是微軟提供基礎設施系統的最後一塊拼圖,其中包括從芯片選擇、軟件和服務器到機架和冷卻系統的一切,這些系統經過自上而下的設計,可以根據內部和客户工作負載進行優化。

亞馬遜從 2013 年推出首顆 Nitro1 芯片至今,AWS 是最先涉足自研芯片的雲端廠商,已擁有網路芯片、伺服器芯片、人工智慧機器學習自研芯片 3 條產品線。AWS 自研 AI 芯片版圖包括推理芯片 Inferentia 和訓練芯片 Trainium。2023 年初,專為人工智慧打造的 Inferentia 2(Inf2)發佈,將計算性能提高了三倍,加速器總內存提高了四分之一,可通過芯片間的直接超高速連接支持分佈式推理,最多可支持 1750 億個參數,這使其成為大規模模型推理的有力競爭者。

除了英偉達明確提到的這兩位外,Meta、谷歌和特斯拉等巨頭似乎也成了英偉達的威脅。

Meta 直到 2022 年,還主要使用 CPU 和專為加速 AI 算法而設計的訂製芯片組合來運行其 AI 工作負載,但 CPU 的效率往往不如 GPU。後來 Meta 取消了於 2022 年大規模推出訂製芯片的計劃,轉而訂購了價值數十億美元的英偉達 GPU。為扭轉局面,Meta 已經在開發內部芯片,並於 5 月 19 日公佈了 AI 訓練與推理芯片項目。據介紹,該芯片的功耗僅為 25 瓦,佔英偉達等市場領先供應商芯片功耗的一小部分,並使用了 RISC-V(第五代精簡指令處理器)開源架構。

谷歌自研芯片 TPU 早在 2016 年就公諸於世,可以為深度學習模型執行大規模矩陣運算,例如用於自然語言處理、計算機視覺和推薦系統的模型。與微軟和亞馬遜相比,谷歌最突出的優勢,就是從系統級的角度設計 TPU,單個芯片固然重要,但在現實世界中如何在系統中組合使用則更為重要。雖然英偉達也從系統角度思考問題,但他們的系統規模比谷歌更小,範圍也更窄。而且谷歌還在 TPU 之間使用了定製的網絡堆棧 ICI。與昂貴的以太網和 InfiniBand 部署相比,這種鏈路延遲低、性能高,類似於英偉達的 NVLink。

而特斯拉,則是從自己自動駕駛的需求出發,推出了兩種自研芯片,分別為全自動駕駛(FSD)和 Dojo D1 芯片。FSD 芯片用於特斯拉汽車上的自動駕駛系統;Dojo D1 芯片則用於特斯拉超級計算機 Dojo 片,它是一種通用的 CPU,目的是為了加速特斯拉自動駕駛系統的訓練和改進。

甚至於英偉達的最大客户之一,Open AI 也盤算起了自研的可能性,據報道,OpenAI 首席執行官山姆·阿爾特曼(Sam Altman)正在籌集資金建設半導體生產設施,生產用於人工智能應用的處理器 。他相信人工智能技術將在未來幾年變得足夠普遍以支持他們自己的半導體供應鏈。報道稱,這家合資企業未來可能將與、和三星代工等公司競爭。

據悉,OpenAI 擬籌建的合資企業與總部位於阿布扎比的 G42 和軟銀集團等潛在投資者進行了討論,旨在解決當前和預期的人工智能相關芯片供應短缺問題,討論中提到,可能會籌集 80 億至 100 億美元購買一家成熟的代工廠或建立一個全新的晶圓廠來滿足 OpenAI 及其潛在合作伙伴的需求。

與老對手相比,英偉達對這些新對手的忌憚更多,因為它們發動的競爭,不在它所熟悉的市場之上,需要考慮顧忌的因素更多,短時間內也沒有合適的應對方法。

英偉達,向何處去

我們對比了英偉達 2014 至 2023 這 10 年財報中所提到的競爭對手,裏面的變動在一定程度上體現了英偉達業務重心的遷移變化,例如當英偉達收購英國基帶芯片廠商 Icera,有志於做手機 SoC 時,就曾在 2014 年,把高通、博通、聯發科、海思、展訊等廠商列為對手,但在 2015 年時放棄手機市場時,就徹底撇除了這部分廠商。

同樣的事情發生在 2020 年,英偉達首次把擁有內部團隊設計芯片的大型互聯網服務公司作為競爭對手,這也是英偉達進軍服務器領域後,發現谷歌 TPU 所帶來的風險與壓力,隨着人工智能風潮的席捲,愈來愈多的企業把自研作為備選,英偉達也順勢將阿里巴巴和百度這樣的中國公司加入其中。

比較有意思的是,ARM 這樣的圖形技術許可方,曾一度成為英偉達的競爭對手,但在英偉達打算收購後,就把它刪去了,即使是後續收購失敗,英偉達也將它作為合作伙伴而非對手這或許意味着英偉達放棄了授權圖形技術的想法,更側重於提供整套解決方案的路線。

如今,對於英偉達來説,AI 無疑是重中之重,但只是迭代自己的 AI 顯卡還不夠,既然自己的對手能夠花大量時間成本去開發去自研,那麼近一年賺得盆滿缽滿,手握充裕現金流的英偉達,也可以撒錢。

根據 PitchBook 的數據,英偉達自 2018 年以來參與的五筆最大的風險投資交易都發生在 2023 年,在過去的幾個月裏,黃仁勳開始瘋狂押寶初創 AI 企業:Inflection AI、Runway、Cohere……大量企業拿到了珍貴的 H100 和 A100 顯卡,成為了英偉達 AI 帝國的一員。

對於英偉達來説,想要不被切斷財路,最根本的辦法,就是多建幾條財路,把自己的 AI 顯卡視作撒出去的種子,押寶各種有可能性的未來,從而吃到最多的 AI 紅利。

英偉達和競爭對手的這場大戲,不妨在 2024 年繼續看下去。

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。