Google's strongest AI chip targets NVIDIA B200, performance skyrockets 3600 times! Google version MCP unifies the AI intelligent body universe

谷歌在雲大會上推出第七代 TPU——Ironwood，性能較 2018 年第一代 TPU 提升 3600 倍，成為首款專為推理設計的 AI 加速器，直接競爭英偉達 B200。新 TPU 的功耗效率提升 2 倍，標誌着谷歌在 AI 硬件領域的重大突破。此外，谷歌還推出了 Agent2Agent 開放協議和多項 AI 平台升級，推動 AI 基礎設施向更智能、更主動的方向發展。

推理時代的首款 TPU 誕生了！

昨晚，一年一度的谷歌雲大會上，首次亮相了谷歌第七代 TPU——Ironwood，直接叫板英偉達 Blackwell B200。

它是谷歌迄今為止性能最強、可擴展性最高的定製 AI 加速器，也是首款專為推理設計的加速器。

相較於 2018 年的第一代 TPU，Ironwood 推理性能飆漲 3600 倍，效率提升了 29 倍。

甚至，第七代全新 TPU 的性能是世界第一大超算的 24 倍。谷歌將於今年晚些時候正式推出 TPU v7。

繼 MPC 之後，谷歌大會上首次亮相 Agent2Agent（A2A）開放協議，為智能體提供一個通用語言，可以在不同生態系統溝通協作。

還有 ADK、Agentspace，為開發者提供了全面構建、操作、管理 AI 智能體的能力。

此外，谷歌雲大會精彩紛呈，Veo 2、Imagen 3、Chirp 3 紛紛迭代升級，文本轉音樂模型 Lyria，Vertex AI 成為唯一覆蓋視頻、圖像、語音和音樂的全新生成式 AI 平台。

下一步，極具性價比 Gemini 2.5 Flash 也將登錄 Vertex AI。

推理時代首款 TPU 出世，媲美 B200

Ironwood 的誕生，不僅標誌着谷歌在 AI 硬件又一大突破，還代表着 AI 基礎設施的重大轉變。

在谷歌看來，當下被動「響應式」模型，正轉變為主動「生成式」智能體。

這種轉變的核心在於，AI 不再僅僅停留在提供原始數據層面，而是能夠主動檢索信息、生成見解。

這正是在這個「推理時代」，谷歌對未來 AI 基礎設施的定義：更智能、更主動、更具協作性。

主要特性

性能顯著提升，同時注重功耗效率，使 AI 工作負載能夠更具成本效益地運行。

相比起第六代 TPU Trillium，Ironwood 在功耗效率（perf/watt）上實現了 2 倍的提升；比 2018 年推出的首款 Cloud TPU，更是高出了近 30 倍。

同時，谷歌先進的液冷解決方案和優化的芯片設計，即使在持續、繁重的 AI 工作負載下，也能可靠地維持高達標準風冷兩倍的性能。

高帶寬內存（HBM）容量大幅增加

Ironwood 芯片搭載了高達 192GB 的顯存，是 Trillium 的 6 倍。

如此一來，便可以處理更大的模型和數據集，同時還減少了頻繁數據傳輸的需求，進而提高了性能。

HBM 帶寬顯著提高

Ironwood 芯片在帶寬方面提升到了驚人的 7.2 Tbps，是 Trillium 的 4.5 倍。

極高的帶寬確保了快速的數據訪問，這對於現代 AI 中常見的內存密集型工作負載至關重要。

芯片間互連（ICI）帶寬增強

Ironwood 的雙向帶寬已增加到 1.2 Tbps，是 Trillium 的 1.5 倍。這種芯片之間更快的通信，有助於大規模高效的分佈式訓練和推理。

用 Ironwood 驅動推理時代

Ironwood 為要求最嚴苛的 AI 工作負載提供了所需的大規模並行處理能力，例如用於訓練和推理的、具有思考能力的超大規模稠密 LLM 或 MoE 模型。

對於谷歌 Cloud 客户，Ironwood 可根據 AI 工作負載需求提供兩種規格——256 芯片或 9,216 芯片。

其中，每個單獨的芯片峯值算力達 4,614 TFLOPs。

當擴展到每個 pod 9,216 個芯片，總計達到 42.5 Exaflop 時，Ironwood 的算力是世界上最大的超級計算機 El Capitan 的 24 倍以上——後者每個 pod 僅能提供 1.7 Exaflops。

不僅如此，Ironwood 還配備了增強版的專門用於處理高級排序和推薦任務的加速器——SparseCore。從而為更廣泛的工作負載提供加速，包括超越傳統 AI 領域，進入金融和科學領域。

Pathways 是由谷歌 DeepMind 開發的 ML 運行時，可在多個 TPU 芯片上實現高效的分佈式計算。

谷歌 Cloud 上的 Pathways 使得超越單個 Ironwood Pod 變得簡單直接，能夠將數十萬個 Ironwood 芯片組合在一起，從而快速推進生成式 AI 計算的前沿。

圖 2. Ironwood 原生支持 FP8，而 v4 和 v5p 的峯值 TFlops 為模擬值

OpenAI 研究員針對 Ironwood 與英偉達 GB 200 做了性能對比，並表示 TPU v7 與 GB200 性能相當，甚至略勝一籌。

全模態 AI 平台來了，Veo 2 再升級

隨着音樂功能的加入，Vertex AI 現在是唯一一個擁有涵蓋所有模態——視頻、圖像、語音和音樂——的生成式媒體模型的平台。

這次放出的重大更新共有四項：

文本轉音樂模型 Lyria，讓客户可以從文本提示詞開始，生成完整的、生產就緒的素材。
Veo 2 的新編輯和攝像機控制功能，可幫助企業客户精確地優化和再利用視頻內容。
Chirp 3 現在包含了 Instant Custom Voice，這是一種僅需 10 秒音頻輸入即可創建定製語音的新方法。
Imagen 3 改進了圖像生成和圖像修復能力，用於重建圖像中缺失或損壞的部分，並使物體移除編輯的質量更高。

Lyria：文生音樂模型

Lyria 能生成高保真音頻，細緻捕捉精妙之處，並能在多種音樂流派中提供豐富、細節詳盡的樂曲。

企業可以提升品牌體驗

根據品牌獨特的調性，為營銷活動、產品發佈或沉浸式店內體驗快速定製配樂。

通過 Lyria，企業可以創建與目標受眾產生深度共鳴的聲音，培養情感聯繫並增強品牌記憶度。

創作者可以簡化內容創作流程

對於視頻製作、播客和數字內容創作而言，尋找完美的免版税音樂可能是一個耗時且昂貴的過程。

而 Lyria 可以在幾分鐘內生成定製音樂曲目，直接契合您內容的情緒、節奏和敍事，從而幫助加速製作工作流程並降低授權成本。例如：

創作一首高能的比波普 (Bebop) 曲調。優先突出令人眩暈的薩克斯管和小號獨奏，以閃電般的速度交換複雜的樂句。鋼琴應提供打擊樂式的和絃伴奏，行進貝斯 (walking bass) 和快節奏的鼓點驅動着狂熱的能量。基調應是令人振奮且激烈的。捕捉深夜、煙霧繚繞的爵士俱樂部的感覺，展示精湛技藝和即興創作。要讓聽眾無法安坐。

Veo 2：擴展編輯功能

Veo 2 則為視頻的創建、編輯和視覺效果添加了一套強大的功能集，使其從一個生成工具轉變為一個全面的視頻創作和編輯平台：

視頻修復 (Inpainting)：無需手動修飾即可獲得乾淨、專業的編輯效果。

你可以移除視頻中不需要的背景圖像、徽標或干擾物，使它們在每一幀中都平滑完美地消失，看起來就像從未存在過一樣。

畫面擴展 (Outpainting)：擴展現有視頻素材的畫面，將傳統視頻轉換為針對網頁和移動平台優化的格式。

你可以輕鬆調整內容來適應不同的屏幕尺寸和寬高比——例如，將橫向視頻轉換為用於社交媒體短視頻的縱向視頻。

應用複雜的電影拍攝技術：新功能包括指導鏡頭構圖、攝像機角度和節奏等。

團隊可以輕鬆運用複雜的電影拍攝技術，無需複雜的提示詞或專業知識。

例如，使用攝像機預設向不同方向移動攝像機、創建延時攝影效果或生成無人機風格鏡頭。

通過連接兩個現有素材創建連貫的視頻。

藉助插值（Interpolation）功能，你可以定義視頻序列的開始和結束，讓 Veo 無縫生成連接幀。

這確保了平滑過渡並保持視覺連續性，從而創造出精美且專業的最終成品。

Chirp 3：即時定製語音和轉錄功能更新

Chirp 3 的高清語音（HD voices）功能提供了超過 35 種語言的自然逼真語音，並有 8 種説話人選項。

除此之外，谷歌還新增了兩個功能：

即時定製語音（Instant Custom Voice）

只需要 10 秒的音頻輸入，即可生成逼真的定製語音。這使得企業能夠個性化呼叫中心、開發無障礙內容，並建立獨特的品牌聲音——同時保持一致的品牌形象。

帶説話人日誌功能的轉錄（Transcription with Diarization）

這項強大的功能可以精確地分離和識別多人錄音中的單個説話人，顯著提高轉錄內容的清晰度和可用性，適用於會議紀要、播客分析和多方通話錄音等應用場景。

Imagen 3：改進質量和編輯功能

作為谷歌最高質量的文本轉圖像模型，Imagen 3 能夠生成具有比之前更好細節、更豐富光照和更少干擾性偽影的圖像。

這次，谷歌顯著改進了 Imagen 3 的圖像修復（inpainting）能力，用於重建圖像中缺失或損壞的部分。

尤其是在物體移除（object removal）方面，不僅質量更高，而且效果也更加自然。

MCP 之後，谷歌再造 A2A 協議

智能體可以幫助人們做很多工作，從訂購新電腦，到協助客服人員，再到支持供應鏈規劃。

智能體越來越實用的關鍵在於讓它們能夠在一個動態的多智能體生態系統中相互協作，跨越孤立的數據系統和應用程序。

為此，谷歌推出了全新的開放協議——Agent2Agent（A2A），獲得了超過 50 家合作伙伴的支持和貢獻。

A2A 協議將使 AI 智能體能夠相互通信，安全地交換信息，並在各種企業平台或應用程序上協調行動。

它是一個開放協議，與 Anthropic 的模型上下文協議（MCP）相輔相成。

A2A 設計原則

A2A 遵循了五大核心原則：

擁抱智能體的能力：A2A 致力於讓智能體以它們自然、非結構化的方式協作。
基於現有標準：A2A 構建在已有的、廣泛使用的標準之上，比如 HTTP、SSE、JSON-RPC。
默認安全：A2A 從設計之初就支持企業級別的認證和授權，與 OpenAPI 的認證機制保持一致，確保安全性。
支持長時間運行的任務：設計 A2A 時考慮了靈活性，它能勝任從快速任務到需要數小時甚至數天的深入研究等多種場景，尤其是在有人的參與下。
不限模態：智能體的世界不只有文本，因此我們設計 A2A 時支持多種模態，包括音頻和視頻流，讓它更加多樣化。

A2A 如何工作

A2A 讓「客户端」智能體和「遠程」智能體之間的溝通變得更順暢。

客户端智能體負責制定和傳達任務，而遠程智能體則負責執行這些任務，儘量提供正確的信息或採取正確的行動。這個互動涉及幾個關鍵功能：

能力發現：智能體可以通過 JSON 格式的「Agent Card」來展示自己的能力。客户端智能體可以根據這個「名片」找到最適合執行某項任務的智能體，並通過 A2A 與遠程智能體溝通。
任務管理：客户端智能體和遠程智能體之間的交流以完成任務為核心，目的是滿足用户的需求。
協作：智能體之間可以互相發送消息，分享上下文、回覆、產物或用户指令。
用户體驗協商：每條消息中包含「parts,」，這是一個完整的內容單元，比如一張生成的圖片。

實例：尋找候選人

用户（比如招聘經理）可以讓自己的智能體去尋找符合職位描述的候選人。

這個智能體會與其他專業智能體互動，幫你挖掘潛在候選人。用户收到推薦名單後，可以再指示智能體安排後續面試，讓找人的過程更順暢。面試結束後，還可以讓另一個智能體幫忙做背景調查。

A2A 有望開啓一個智能體相互操作的新時代，推動創新，打造更強大、更靈活的 AI 智能體系統。我們相信，這個協議將為未來鋪平道路，讓智能體能夠無縫協作，解決複雜問題，提升我們的生活。

我們致力於與合作伙伴和社區一起，公開構建這個協議。我們會把協議開源，併為貢獻者設立清晰的參與路徑。

谷歌 AI 代碼助手，變身超強智能體

此次大會的另一個更新，就是谷歌的 AI 編碼助手——Gemini Code Assist，已經在預覽中獲得了「智能體」能力！

在 Cloud Next 大會上，谷歌宣佈：Code Assist 現在可以部署新的 AI 智能體，這些智能體可以執行多個步驟，來完成複雜的編程任務。

例如，這些智能體可以從 Google Docs 中的產品規格創建應用程序，或者將代碼從一種語言轉換為另一種語言。

另外，Code Assist 現在除了其他編碼環境外，還可在 Android Studio 中使用。

這次升級，也是谷歌被 GitHub Copilot、Cursor 和 Devin 這些競爭者給逼瘋了。

肉眼可見，現在 AI 編程隱含着巨大的掘金市場，各家的競爭也日趨白熱化。

不過，Code Assist 能做到什麼程度，目前還不清楚。研究表明，即使是今天最好的代碼生成 AI，也往往會引入安全漏洞和錯誤，這是由於編程邏輯理解能力的弱點。

比如對 Devin 的一項評估就發現，它只完成了 20 項任務中的 3 項。

接下來，就讓我們期待 Gemini Code Assist 在實際編程環境中的表現了。

本文來源：新智元，原文標題：《谷歌最強 AI 芯片狙擊英偉達 B200，性能狂飆 3600 倍！谷歌版 MCP 一統 AI 智能體宇宙》

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。