誰能顛覆英偉達？

前 AMD 高管談 AI 芯片競爭：芯片開發商將需要改變他們構建芯片的方式，把 GPU 和 CPU 放在一起，以更快地準備和加載數據、加速模型訓練。

David Bennett 曾是 AMD 以及聯想的高管，當前擔任 Tenstorrent 的 COO（首席客户官），在最新的外媒採訪中，Bennett 認為，未來的芯片將結合 GPU 和 CPU，以更快地準備和加載數據，從而加速模型訓練的過程，這一點我們從 3 年前的蘋果 M 系列發佈就能看出。

談到蘋果，6 月份也曾分享過硅仙人 Jim Keller 作為 Tenstorrent CEO 發表的關於 AI 芯片與市場競爭洞察，Keller 是一位硬件傳奇人物，曾開發 Apple 的 A4 和 A5 處理器，並在 2016～2018 年參與了 Tesla 的自動駕駛硬件工作。

目前，Tenstorrent 已經從投資者那裏籌集了超過 3 億美元，包括 Fidelity Ventures 和 Hyundai Motor Group，目前正按照 Bennett 的建議進行運作，提供的服務覆蓋自家的芯片以及雲服務。

Bennett 認為大多數初創公司都將會走向破產，為了生存，這些初創公司保持靈活性，避免將自己侷限於狹窄的用例，包括像 Tenstorrent 這樣的幾十家 AI 初創公司羣體，這些公司從投資人那裏拿了數十億美元，並以此來挑戰英偉達。

Bennett 表示，今天的芯片初創公司需要在製造專為 AI 設計的硬件和過分依賴當今流行的模型之間走一條細線，最初 GPU 是為計算機圖形而設計的，而 GPU 執行多個計算的能力恰好使其適用於 AI 應用，但這個意外的好運也為英偉達帶來了困境 —— 如果不危及英偉達現有 GPU 業務，就很難從頭開始創建芯片，這給了新興初創企業建造專為 AI 設計的新硬件的機會。

Bennett 表示 Tenstorrent 的工程師為 “稀疏” 神經網絡的未來設計了 Grayskull 芯片，這些神經網絡剔除了多餘的信息，他認為專注於為 LLM 建造芯片的初創公司正在過分依賴支持 LLM Transformer 架構。

從內部來看，基於 Transformer 的模型本質上是預測最有可能的下一個單詞，因此它們被批評是基於概率而非實際推理生成回應的。

一方面，Bennett 表示 LLM 壽命相對較短，昨天還很火的模型，一兩週後就消失了；另一方面，專為推理製造芯片的硬件公司，如 d-Matrix，這家公司正計劃在明年上半年發佈專為推理設計的芯片。

乍一看，這不失為一個好主意，但 Bennett 發現越來越多使用生成式 AI 軟件的用户更願意利用現有的專有或開源模型，而不是從頭開始構建自己的模型。

因此，許多人認為，公司將花費更多的資金來運行這些模型（推理），而不是創建它們（訓練）。Bennett 認為從商業的角度看這沒問題，但過分專注於推理阻止了硬件開發商服務於可能變得更受歡迎的其他用例。

例如，僅用於推理的芯片通常是為運行模型所需的低精度計算而構建的，但是，如果廠商希望調整他們的模型，這可能需要能夠處理更高精度計算的芯片。

要在即將到來的 AI 芯片競爭中生存，Bennett 認為芯片開發商將需要改變他們構建芯片的方式，今天大多數芯片將 GPU 與 CPU 分開，但越來越多的尖端芯片，比如英偉達的 Grace Hopper Superchip 和 AMD 即將推出的 MI300A 芯片，都將 GPU 和 CPU 放在一起，這樣的佈局使 CPU 能夠更快地準備和加載數據到 GPU，從而加速模型訓練的過程。

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。