AI 時代,沒有人能擺脱英偉達!

36Kr
2023.11.20 04:00
portai
I'm PortAI, I can summarize articles.

谷歌、亞馬遜、微軟們都在開發自研芯片,試圖在硬件層面降低了對英偉達的依賴,但在軟件層面,他們又不得不與英偉達保持合作。

作者|楊逍

編輯|蘇建勳

微軟推出自研芯片,人工智能市場拉開新序幕。

11 月 16 日,微軟在其科技大會上發佈了兩款自研芯片——用於雲端訓練和推理的 AI 芯片 Azure Maia 100,和 CPU(中央處理器)Azure Cobalt 100,分別在 AI 芯片和 CPU 芯片上正面對剛英偉達和英特爾。

2023 年 3 月 ChatGPT 火熱後,英偉達的 AI 芯片 A100、H100 便一卡難求,英偉達佔據了人工智能芯片市場至少 90% 的份額。

AI 芯片是 AI 時代石油一般的存在。大模型公司想更快推出模型和 AI 應用,就必須大量購入英偉達的芯片。而英偉達的產能有限,按照上一年計劃制定的供給,遠不能滿足蓬勃的市場需求,搶不到芯片的雲廠商、互聯網巨頭不得不高價搶購。

大模型公司尚未賺到錢,但英偉達先賺得盆滿缽滿,哪怕是大模型頭部企業 OpenAI,每年也不得不花費鉅額資金在 AI 算力上。

自研成為企業共同的希冀,在微軟之前,谷歌和亞馬遜都已用上了自研的芯片,而後來者 Meta、OpenAI 等也走在自研芯片降低成本的路上。

但從英偉達推出 DGX Cloud 雲服務和基礎模型工具等看來,這家芯片巨頭正試圖構建一個更龐大的商業版圖——即使科技巨頭們都試圖在硬件層面降低了對英偉達的依賴,但在軟件層面,他們又不得不與英偉達保持合作。

雲巨頭集體向 “自研芯片” 看齊

2008 年,淘寶的數據急速增長,存儲數據需要花費的成本越來越稿,這也是後來阿里決定進軍雲計算產業的重要原因。

如今,同樣的困境擺在微軟、谷歌等一眾雲巨頭公司面前,只是瓶頸從數據中心變成了建數據中心的芯片。這種對高性能 AI 芯片的渴望和需求,隨着大模型及生成式 AI 的發展將越來越強。

微軟從 2019 年便開始自研 AI 芯片,在此次技術大會上,兩款自研人工智能芯片 Maia 100 和雲計算處理器 Cobalt 100 也終於出爐。

微軟兩款新芯片

Cobalt 100 有 128 個核心,是 CPU 芯片,目前已在微軟的部分業務中得到了應用,並將於明年上市。Maia 100 則是 AI 芯片,它採用了 5nm 製程,主要用來運行大語言模型,幫助 AI 系統更快地處理大量數據。

雖然 AI 為微軟帶來了巨大的未來業務預期,但由於 AI 仍處於發展起步階段。有媒體曾報道,在 2023 年年初,微軟 Copilot 平均每位用户每月帶來的虧損超過 20 美元,有的用户甚至造成了最高達到 80 美元的虧損。

除了是英偉達數據中心市場的大客户,微軟還是目前最火熱的人工智能獨角獸 OpenAI 的最大股東。為了幫助 OpenAI 訓練 ChatGPT,微軟曾花費數億美元向英偉達購入芯片。

不止微軟,包括谷歌和亞馬遜在內的雲巨頭們都希望降低芯片送水人英偉達單一供應商的牽制。

谷歌在 2016 年便推出第一代自研 AI 芯片 TPU,2021 年 5 月又推出了第四代 TPU v4,他們目前已將 4000 個 TPU v4 串聯在一起,構建了一台超級計算機,並在自己的雲服務中部署了數百台 TPU v4 超級計算機。

亞馬遜也推出了四個系列的自研芯片——網絡芯片 Nitro 系列,服務器芯片 Graviton 系列,AI 推理芯片 Inferentia 系列、AI 訓練芯片 Trainium,後兩款芯片對應的是 GPU 市場。

定製化的 AI 芯片,可以讓企業更好地將芯片硬件的性能和效率發揮出來,也可以基於硬件更好地去設計軟件,提高芯片性能的實際利用率。

比起 AMD、英特爾,微軟、谷歌等公司自研芯片的難度會小很多,他們無需生產通用芯片,更容易繞開英偉達在 Cuda 上的壟斷。一位行業資深人士告訴 36 氪:“Cuda 上寫好了非常多的軟件,但一家公司可能只需要用到其中的不到 10% 甚至 5% 的軟件,當企業有足夠的人、能算得過來帳,完全可以將軟件重寫一遍。”

不過,微軟推出自己的芯片,並不意味着要拋棄英偉達或 AMD。微軟可以在某些領域採用自研芯片,來降低總體成本,增加與英偉達的議價權。

未來,微軟仍會繼續採購英偉達的芯片,只不過,2024 年會開始採用 AMD MI300 芯片,培養第二供應商,以降低對英偉達的依賴。

繞不開的英偉達

科技巨頭們試圖降低對英偉達的依賴,對此英偉達 CEO 黃仁勳心知肚明。

在內部他經常強調,“公司距離倒閉只有 30 天”。強烈的危機意識讓他對商業競爭保持着極強的敏鋭度。

就在亞馬遜、谷歌、微軟等一眾公司想要在硬件層面上減少與英偉達的羈絆時,英偉達開始向更上層的軟件和算力進軍。

在今年 3 月 21 日的 GTC 大會上,英偉達發佈了 DGX Cloud,這是一款能提供英偉達最先進算力的雲服務產品,它背後隱藏着黃仁勳巨大的野心——將硬件賣給雲合作伙伴,再租用算力來運行 DGX Cloud,從而提供完整的雲服務。不知不覺間,英偉達將自己和雲廠商們放到了同一牌桌。

不過,黃仁勳也表示,這是一場雙贏的舉措,他曾公開表示恰當的雲服務組合比例應該是 10% 英偉達 DGX 加上 90% 的公有云。

雲巨頭想擺脱英偉達,英偉達便扶持起新的合作伙伴。今年,英偉達已投資了 CoreWeave、Lambda Labs 兩家美國的中小云服務商。

2022 年 11 月,CoreWeave 就和谷歌雲、微軟雲一樣,是首批能提供採用英偉達 H100 超級計算機雲的供應商。與大型通用公共雲相比,CoreWeave 的定價可以幫用户節省 80% 的費用。在商業世界,同樣都是英偉達的芯片,客户為什麼不選擇更便宜的算力?

除了參與雲算力的競爭,英偉達還將觸角伸到了 AI 軟件上,站在基座大模型公司的站位上,籠絡更多的 AI 公司,讓他們基於英偉達的工具和模型研發模型。

英偉達推出了用於創建和自定義生成 AI 模型的 AI Workbench,為用户提供了一些 AI 基礎模型,還提供了英偉達 NeMo 框架和工具,只有一個目的——讓不具備大模型研究能力的公司,直接用英偉達提供的大模型,生成自己的大模型產品。

可以明顯看到,英偉達在投資、收購上的動作激進了很多。2023 年以來,英偉達便投資收購了 10 多家人工智能相關企業,如 2 月收購 AI 優化平台公司 OmniML,3 月收購人工智能模型開發領域的 Adept,6-7 月則先後投資了語言模型開發企業 Cohere、Inflection AI 與來自德國的 Aleph Alpha 等。

這家芯片巨頭正加強自己與大模型公司和 AI 應用公司的聯繫。從一家只賣硬件的公司,變成為 AI 產業提供 “一條龍服務” 的計算平台公司。

正如,在這場微軟推出自研 AI 芯片的高光時刻大會上,英偉達老黃仍然到場,從硬件合作伙伴化身軟件合作伙伴,宣佈將基於微軟雲提供自定義生成式服務 AI foundry。

在這個 AI 時代裏,沒有人能擺脱英偉達。