Report: NVIDIA will launch a "new inference chip" incorporating Groq LPU design at next month's GTC conference

華爾街見聞
2026.02.28 03:58
portai
I'm PortAI, I can summarize articles.

英偉達即將推出的推理芯片系統整合了 Groq 的 “語言處理單元”(LPU)技術,採用與傳統 GPU 截然不同的架構,通過更廣泛的 SRAM 集成和 3D 堆疊技術,專門針對大模型推理中的延遲和內存帶寬瓶頸進行優化。該新品可能基於下一代 Feynman 架構設計,從而大幅降低 AI 智能體運行的能耗與成本。OpenAI 承諾採購並投資 300 億美元。

英偉達計劃在下個月的 GTC 開發者大會上發佈一款整合了 Groq“語言處理單元”(LPU)技術的全新推理芯片,代表着英偉達正加速向推理計算領域轉型,以應對客户對高效能、低成本計算方案的迫切需求。

據華爾街日報報道,這款被英偉達首席執行官黃仁勳稱為 “世界從未見過” 的全新系統,專為加速 AI 模型的查詢響應而設計。該產品的推出預計將重塑當前的 AI 算力市場格局,直接影響正在尋找更具成本效益替代方案的雲服務提供商和企業級投資者。

作為市場對該技術初步認可的重要標誌,ChatGPT 開發商 OpenAI 已同意成為該新處理器的最大客户之一,並宣佈將向英偉達購買大規模的 “專用推理產能”。這一舉動不僅穩固了英偉達的核心客户盤,也向市場發出了明確信號:支持自主 AI 智能體的底層基礎設施正從大規模預訓練轉向高效推理。

在面臨谷歌、亞馬遜以及眾多初創公司激烈競爭的背景下,英偉達正在突破傳統圖形處理器(GPU)的單一依賴。通過引入新的技術架構以及探索純中央處理器(CPU)的部署模式,該公司試圖在 AI 產業演進的下一階段繼續鞏固其市場統治地位。

整合 LPU 設計,直擊大模型推理瓶頸

隨着 AI 行業從模型訓練向實際應用部署轉移,推理計算成為核心焦點。AI 推理主要分為預填充(pre-fill)和解碼(decode)兩個階段,其中大型 AI 模型的解碼過程尤其緩慢。針對這一技術瓶頸,英偉達選擇通過外部技術整合來突破物理極限。

據華爾街日報報道,英偉達去年底斥資 200 億美元獲得了初創公司 Groq 的關鍵技術許可,並在一場大規模的 “核心聘用” 交易中吸納了包括創始人 Jonathan Ross 在內的高管團隊。Groq 所設計的 “語言處理單元”(LPU)採用了與傳統 GPU 截然不同的架構,在處理推理功能時表現出極高的效率。

業內分析認為,即將發佈的新品可能涉及具備顛覆性的下一代 Feynman 架構。據華爾街見聞此前文章,Feynman 架構可能採用更廣泛的 SRAM 集成方案,甚至通過 3D 堆疊技術將 LPU 深度整合其中,專門針對延遲和內存帶寬這兩大推理瓶頸進行優化,從而大幅降低 AI 智能體運行的能耗與成本。

拓展純 CPU 部署,提供多元化計算選擇

在引入 LPU 架構的同時,英偉達也在靈活調整其傳統處理器的使用方式。英偉達以往的標準做法是將 Vera CPU 與其強大的 Rubin GPU 捆綁在數據中心服務器中,但在處理某些特定的 AI 智能體工作負載時,這種配置被證明成本過高且能效不足。

部分大型企業客户發現,純 CPU 環境在運行特定 AI 任務時更為高效。順應這一趨勢,英偉達本月宣佈擴大與 Meta Platforms 的合作,進行了首次大規模的純 CPU 部署,以支持 Meta 的廣告定向 AI 智能體。這一合作被市場視為英偉達戰略調整的早期窗口,表明公司正超越單一的 GPU 銷售模式,試圖通過多元化的硬件組合來鎖定 AI 市場的不同細分領域。

市場需求換擋,競爭態勢持續升級

這種底層硬件設計的演進,直接源於科技行業對 AI 代理應用需求的爆發。許多構建和運營 AI 智能體的公司發現,傳統的 GPU 成本過於昂貴,且在實際運行模型時並非最佳選擇。

OpenAI 的動向凸顯了這一趨勢。除了承諾採購英偉達的新系統以改進其快速增長的 Codex 工具外,OpenAI 上個月還與初創公司 Cerebras 達成了一項價值數十億美元的計算合作。據 Cerebras 首席執行官 Andrew Feldman 稱,其專注於推理的芯片在速度上超越了英偉達的 GPU。此外,OpenAI 還簽署了使用亞馬遜 Trainium 芯片的重大協議。

不僅是初創公司,主要雲服務商也在加緊自研芯片步伐。被廣泛視為自動編碼市場領導者的 Anthropic Claude Code,目前主要依賴亞馬遜 AWS 和 Alphabet 旗下谷歌雲設計的芯片,而非英偉達的產品。面對競爭對手的圍剿,黃仁勳在接受 wccftech 採訪時強調,英偉達正從單純的芯片供應商向涵蓋半導體、數據中心、雲和應用的完整 AI 生態系統構建者轉型。對於投資者而言,下個月的 GTC 大會將是檢驗英偉達能否在推理時代延續其 90% 市場份額神話的關鍵節點。