
TPU vs GPU: Google's chip commercialization accelerates, can NVIDIA's moat hold up?

雖然單顆 TPU 不及最強 GPU,但谷歌藉助超大規模集羣和更高性價比,正在撬動英偉達的定價權和市場控制力。真正的戰場在生態與商業模式——英偉達靠 CUDA 鎖定用户,谷歌則用 TPU + Gemini 打開新入口。英偉達在通用性和生態成熟度上佔據明顯優勢,但當越來越多頭部客户開始 “試水” TPU,任何一絲鬆動,都會被市場迅速放大。
當谷歌開始嘗試把自研的 AI 芯片 TPU(Tensor Processing Unit)賣向更廣闊的市場,這場原本只發生在雲端的 “芯片暗戰” 正在被推到台前,並對 AI 芯片霸主英偉達構成實質性挑戰。
科技媒體 The Information 最新文章分析稱,英偉達無法忽視的是,全球最先進的兩個 AI 模型——來自谷歌和 Anthropic 的模型,完全或部分使用谷歌自研的 TPU 芯片開發,而非英偉達的 GPU。這一現實已促使英偉達最大客户之一 Meta 認真考慮使用谷歌的 TPU 來開發新模型。
這意味着,TPU 的角色已從 “谷歌內部工具” 升級為一個可以被大型 AI 公司認真考慮的替代方案。據摩根士丹利此前分析,谷歌計劃 2026 年生產超過 300 萬片 TPU,2027 年約 500 萬片,而英偉達目前的 GPU 產量約為谷歌 TPU 的三倍。
雖然單顆 TPU 不及最強 GPU,但谷歌藉助超大規模集羣和更高性價比,正在撬動英偉達的定價權和市場控制力。真正的戰場在生態與商業模式——英偉達靠 CUDA 鎖定用户,谷歌則用 TPU + Gemini 打開新入口。英偉達在通用性和生態成熟度上佔據明顯優勢,但當越來越多頭部客户開始 “試水” TPU,任何一絲鬆動,都會被市場迅速放大。
性能對比:單芯片輸,系統贏?
從純粹的算力來看,最先進 TPU(代號 Ironwood)在每秒浮點運算次數(FLOPS)上約為英偉達 Blackwell GPU 的一半。
但這並不意味着 TPU 就處於下風。
The Information 稱,谷歌的策略是通過 “集羣化” 來放大性能優勢:數千顆 TPU 可以被串聯成一個 “超級 Pod”,在訓練超大模型時具備出色的性價比與能效比。而英偉達單個系統最多隻能直接連接約 256 顆 GPU 芯片,儘管用户可以通過額外的網絡設備擴展規模。
在大模型時代,已經很難用 “單芯片性能” 簡單定勝負,系統級設計、互連能力和能效比,正在成為新的核心指標。
關鍵差異:軟件生態仍是英偉達護城河
真正構成英偉達 “護城河” 的,不只是硬件,而是深度綁定的 CUDA 軟件生態。
根據 The Information 對谷歌和英偉達前員工的調研,TPU 的使用成本還跟模型相關。
對已使用英偉達 Cuda 編程語言運行 AI 的客户而言,租用英偉達芯片更具成本效益。而有時間和資源重寫程序的開發者可通過使用 TPU 節省成本。
相較而言,對 Anthropic、蘋果和 Meta 等技術水平較高的 TPU 客户,使用 TPU 的挑戰相對較小,因為它們更善於為 AI 應用編寫服務器芯片軟件。TPU 在運行針對其優化的谷歌 Gemini 模型時成本效率尤其突出。
然而軟件兼容性仍是 TPU 面臨的主要挑戰。TPU 僅能與 TensorFlow 等特定 AI 軟件工具順暢配合,而大多數 AI 研究人員使用的 PyTorch 在 GPU 上運行效果更佳。多名工程師表示,如果開發者花時間編寫定製軟件充分利用 GPU,其性能可能超過 TPU。
成本之戰:TPU 並非 “廉價”
在製造成本上,TPU 與 GPU 其實相差不大。Ironwood 使用了比 Blackwell 更先進、也更昂貴的製程技術,但由於芯片體積更小,同一片晶圓上可切割出更多 TPU,從而部分抵消了成本劣勢。
兩者都使用高帶寬內存(HBM),而在工藝和封裝方面,博通扮演了極其關鍵的角色——不僅參與封裝設計,還提供了 SerDes(高速數據傳輸核心技術)等關鍵 IP。分析機構估算,博通從 TPU 項目中獲得的收益至少達到 80 億美元。
值得注意的是,英偉達當前的硬件業務毛利率高達 63%,而谷歌雲整體只有 24%。這也解釋了,為什麼英偉達能在價格戰中仍保持極強的盈利能力。
產能博弈:台積電的 “平衡術”
在晶圓代工端,台積電並不會將所有產能押注在單一客户上。即使英偉達需求極其旺盛,也很難獲得 “無限供應”。這意味着,市場上始終會留出空間給其他方案——包括 TPU。
根據摩根士丹利的預測,谷歌計劃在 2026 年生產 300 萬顆 TPU,到 2027 年達到 500 萬顆,甚至可能更高。目前,英偉達 GPU 的產量大約是 TPU 的 3 倍左右,差距正在縮小。
當供應開始變得多元化,客户自然也會更加願意比較、議價與分散風險。
商業化難題:賣芯片遠比想象難
The Information 認為,如果谷歌真的想大規模對外銷售 TPU,它需要幾乎重建一整套產業鏈——包括服務器廠商、分銷網絡、企業級售後支持等,這基本就是 “複製一個英偉達”。
此外,如果客户把 TPU 部署在自己的數據中心,谷歌將失去部分雲服務收入(如存儲、數據庫服務等),這就意味着:未來 TPU 很可能並不會走 “低價路線”,而是通過其他費用來彌補收入缺口。
換句話説,這並不是一門 “便宜就能贏” 的生意,而是一場複雜的戰略選擇。
從更高維度看,TPU 對谷歌的意義並不只在硬件收入本身。更重要的是:可以成為與英偉達談判的籌碼;有助於推廣 Gemini 及其 AI 生態讓谷歌在 AI 基礎設施上擁有更大自主權。只要客户願意 “多一個選項”,英偉達就不再擁有絕對定價權。
這,或許才是谷歌真正想要的。
