
Elon Musk's interpretation of the AI trend: OpenAI has been caught up, Microsoft has retreated, and the "Inference Era" requires only 2-3 giant data centers

Gavin Baker 表示,未來數據成為競爭核心,無法獲得獨特、有價值數據的前沿模型是史上貶值最快的資產,而蒸餾只會放大這一點。未來用於預訓練的巨型數據中心只需 2-3 個,預訓練和推理的計算資源分配將是 5/95。
AI 大模型競賽愈發白熱化,下半場將聚焦推理與數據。
2 月 23 日,馬斯克點讚了一條關於 AI 模型競爭路線的分析,他稱讚道 “分析得很好”,值得一提的是,上週馬斯克旗下 xAI 正式發佈 Grok 3 大模型。

這篇推文是由 Gavin Baker 發佈,他在文章中表示,AI 產業格局的變革正在加速,OpenAI 的先發優勢消退,微軟也選擇後撤一步。
Gavin 還預計,未來數據成為競爭核心,無法獲得獨特、有價值數據的前沿模型是歷史上貶值最快的資產。Meta 等巨頭通過數據壟斷和算力規模構建護城河,而中小玩家聚焦差異化部署和成本優化。
不過,Gavin 仍看好 xAI 和 OpenAI,他表示,如果 OpenAI 在 5 年後仍然是該領域的領導者,那可能是因為先發優勢和規模優勢,以及產品影響力。
OpenAI 的先發優勢消退,微軟也選擇後撤一步
Gavin 在推文中指出:
當 ChatGPT 在 2022 年 11 月橫空出世時,OpenAI 通過激進押注 Scaling Law,在生成式 AI 領域建立了長達 7 個季度的統治地位。但這一優勢窗口正在關閉:Google 的 Gemini、xAI 的 Grok-3,以及 Deepseek 的最新模型,均已達到與 GPT-4 相近的技術水平。
就連 OpenAI 創始人 Altman 也指出,OpenAI 未來的領先優勢將更加狹窄;微軟 CEO 納德拉基本上表示,他們在模型能力方面領先的獨特時期即將結束。
據 The Information 此前報道,微軟內部備忘錄顯示,由於預訓練邊際效益遞減,原計劃投入 160 億美元升級預訓練基礎設施的方案已被叫停,微軟轉而專注於為 OpenAI 提供推理以獲取收益。
納德拉也在此前的播客節目中表示,數據中心可能建設過剩,租賃優於自建,微軟甚至可能會使用開源模型來支持 CoPilot。Gavin 認為,這些預示着單純依靠參數擴張建立壁壘的 “預訓練時代” 已走向終結。
獨家數據資源成為護城河
Gavin 認為,當模型架構趨同,獨家數據資源成為護城河。
Gavin 在推文中表示:
我多次轉述 EricVishria 的話,無法獲得獨特、有價值數據的前沿模型是史上貶值最快的資產,而蒸餾只會放大這一點。
如果未來前沿模型無法訪問 YouTube、X、TeslaVision、Instagram 和 Facebook 等獨特而有價值的數據,則可能沒有任何投資回報率。
從這個角度來看,扎克伯格的策略似乎也要明智得多。獨特的數據可能最終成為預訓練數萬億或千萬億參數模型差異化和 ROI 的唯一基礎。
這解釋了為何扎克伯格將 Meta 的 AI 戰略錨定在社交數據閉環,據媒體此前報道,Instagram 用户的圖像標註數據,使 Meta 的多模態模型訓練效率提升 40%。
巨型數據中心只需 2-3 個,推理所需算力佔 95%
這一變化也將帶來 AI 基礎設施格局的顛覆性變化,Gavin 預計,
預訓練算力:需超大規模集羣(10 萬卡級),但參與者將縮減至 2-3 家,技術堆棧追求極致性能(液冷、核能供電),這一中心堪比 “法拉利” 級超算中心。
推理算力:較小的 6-10 家數據中心,分佈式、低成本架構主導,地理就近部署與能效比成關鍵,使用風/光能源,基於量化壓縮技術(如 Deepseek R1 的 1-bit LLM)支撐低成本推理,是 “本田” 級邊緣節點。
Gavin 強調,推理模型是極其計算密集型的,具備強大的計算能力,模型才能高效地完成推理任務。但與之前那種預訓練和推理階段計算資源分配大致各佔一半的情況不同,現在會變成預訓練佔 5%,推理階段佔 95%。卓越的基礎設施將至關重要。
整體來看,未來 AI 行業可能呈現 “預訓練集中化,推理去中心化” 的兩極格局,數據成為權力核心,巨頭通過數據壟斷和算力規模構建護城河,而中小玩家聚焦差異化部署和成本優化。

