Meta aims to transform AI capital expenditures into a "computing power balance sheet"! From the AI arms race to entering cloud computing, Meta wants to fully capitalize on the dividends of the AI inference era

智通財經
2026.07.01 14:09

Meta 正制定前所未有的雲計算基礎設施業務計劃,旨在將內部 AI 算力資產轉化為可外部出租的平台。通過向客户出售富餘的 AI 算力和獨家大模型資源訪問權限,Meta 試圖與 AWS、Azure 等巨頭競爭,並將鉅額資本開支轉化為具備營收彈性的 “AI 算力資產負債表”。此舉意在抓住 AI 推理時代紅利,應對日益增長的雲端算力需求。

智通財經 APP 獲悉,Facebook 與 Instagram 母公司 Meta Platforms Inc.(META.US) 正在制定一項該公司前所未有的雲計算基礎設施業務宏圖計劃,該業務將出售對 Meta 大規模部署的 AI 算力基礎設施和獨家 AI 大模型資源的訪問權限,從而與亞馬遜雲服務 (即亞馬遜 AWS)、微軟 Azure 雲平台和谷歌雲平台 (Google Cloud) 等雲計算行業領導者們形成新的競爭維度。

根據媒體援引的知情人士透露消息最新報道,Meta 一直在快速鎖定昂貴的人工智能數據中心建設進程以及 AI GPU/數據中心 CPU 等龐大的底層 AI 算力基礎設施資源,以支撐自身的人工智能雄心壯志;與此同時,該公司正在組建一項重要的新業務,通過向外部客户出售富餘 AI 算力資源來創造 AI 相關營收。知情人士因相關細節尚未公開而要求匿名。

Meta 進軍雲計算的核心邏輯,本質上是在全球 AI 算力資源需求持續井噴式擴張之際,聚焦於把此前被市場屢次質疑的鉅額 AI 資本開支,改造成一項具備外部營收彈性的 “AI 算力資產負債表”。Meta 正在建設雲業務以出售富餘 AI 算力,與此同時,近期谷歌限制 Meta 使用 Gemini 模型的報道也在反向證明,AI 算力需求如此之強,連超大科技公司內部都面臨雲端 AI 算力不足,Google Cloud 一季度營收雖達 200 億美元,但算力約束仍限制更高增長並推高積壓訂單。

這也意味着 Meta 的策略不是簡單 “跨界做雲”,而是力爭率先為 AI 超級智能開發、廣告推薦、視頻生成、AI 助手和模型訓練/雲端大規模 AI 推理囤積 GPU/ASIC/TPU 資源、網絡基礎設施、HBM/DRAM/NAND 存儲組件、電力與數據中心容量;一旦階段性過剩,就把這部分容量封裝成模型 API 或原始算力租賃,對標 AWS Bedrock 或者 CoreWeave 式新雲領軍者,從而為 “過度 AI 算力基礎設施建設” 提供下行保護,也為投資者提供 AI 資本開支回收路徑。

更深層來看,Meta 是在押注 AI 工作負載從訓練中心轉向推理中心後的長期算力資源稀缺。麥肯錫預計,到 2030 年全球數據中心為滿足算力需求需要約 6.7 萬億美元投資,其中 AI 推理端處理負載相關數據中心資本開支約 5.2 萬億美元;國際能源署預計全球數據中心用電到 2030 年將翻倍至約 945 太瓦時,其中 AI 驅動的加速服務器用電年增速約 30%;華爾街金融巨頭高盛也預計美國數據中心電力需求將從 2025 年的 31 吉瓦升至 2027 年的 66 吉瓦。

因此 Meta 這一步棋最終聚焦的是 AI 時代最稀缺的 “可用推理產能”:GPU/ASIC/TPU AI 算力資源集羣、低延遲網絡、模型託管、token 計費乃至超大規模數據中心的高效率調度能力。

華爾街對於 Meta 估值錨可能從 “廣告平台 + 元宇宙支出折價” 切換到 “廣告現金牛 +AI 模型入口 + 算力基礎設施期權”;但成敗關鍵不在於能否買到芯片,而在於能否補齊企業銷售、AI 開發者生態、天量級別雲端 AI 算力租賃服務可靠性、雲平台軟件棧和單位 token 經濟性

從 AI 超級智能軍備賽到挑戰 AWS、Azure 與谷歌雲,Meta 力爭把 “富餘算力” 變成雲業務飛輪

據瞭解,Meta 主導的一項重要潛在計劃包括出售對託管在 Meta 現有 AI 算力基礎設施上的多種 AI 模型的訪問權限;知情人士稱,這種做法類似於亞馬遜雲服務的 Bedrock 產品。Meta 將運營支撐這些模型的數據中心組件以及 AI 芯片等細分算力資源,還包括其自身的最新開發的 Muse Spark 模型,並向開發者收取訪問費用。

知情人士稱,該公司還在考慮出售 “原始” 的雲計算原生算力容量的訪問權限,類似於 CoreWeave Inc.等所謂新雲業務領軍者們。知情人士稱,這些新業務線的開發是 Meta Compute 的一部分;Meta Compute 是一項內部計劃,旨在建設和管理公司的 AI 算力基礎設施部署工作。Meta Compute 由 Meta 基礎設施負責人 Santosh Janardhan、Meta 超級智能實驗室 AI 部門內部領導者 Daniel Gross 以及 Meta 總裁 Dina Powell McCormick 領導。

Meta 發言人拒絕置評。該公司的計劃仍在制定中,相關戰略也可能發生變化。Meta 股價週三美股盤初交易中一度上漲近 10%,隨後回吐部分漲幅。CoreWeave 股價盤初則暴跌超 10%。

Meta 已將發展 AI“超級智能” 列為最高優先事項之一,並已承諾投入數千億美元建設數據中心以及其他重要 AI 算力基礎設施,例如其認為實現這一目標所必需的昂貴 AI 芯片以及一系列 AI 算力相關硬件體系。這項投資已經讓投資者對 Meta 如何從這些千億美元級別的鉅額支出中獲得回報感到焦慮,其中的鉅額支出包括與 CoreWeave、Alphabet Inc.旗下谷歌和雲計算巨頭甲骨文 (Oracle Corp.) 等雲計算領軍者們達成的重大算力交易。

雲計算業務確實提供了一種收回部分 AI 算力基礎設施投資的重要方式。亞馬遜雲服務、Azure 和谷歌雲已花費數十年建設超級雲計算平台,通過互聯網平台生態出租算力、企業端巨大存儲容量以及某些大型軟件訪問權限——這些業務如今每個季度創造數百億美元營收規模。

隨着 AI 需求激增,這些服務商也已擴張至出租訓練和運行 AI 模型所需的專用 AI 芯片以及廣泛 AI 算力基礎設施資源與容量。這是一項複雜業務,不僅需要龐大的數據中心集羣,還需要軟件平台、企業銷售團隊和客户支持運營共同組建起來的龐大雲計算生態。

埃隆·馬斯克的 SpaceX 在 2 月收購其 AI 初創公司 xAI 後,最近成為這一雲端算力資源租賃領域的關鍵玩家;該公司今年早些時候向 AI 應用領軍者 Anthropic PBC 出租了其位於孟菲斯的大型 AI 數據中心底層算力資源的雲端訪問權限,並與谷歌達成了一項雲端 AI 算力租賃交易。根據 Bloomberg Intelligence 的一項預測數據,這一戰略可能幫助 xAI 到 2028 年創造超過 500 億美元營收規模,併到 2030 年創造至少 1000 億美元營收。

儘管存在複雜性,Meta 首席執行官馬克·扎克伯格已向投資者們表示,他願意出售富餘算力基礎設施,甚至願意推出所謂大模型 API 服務,讓客户們為 AI 使用量付費——這類業務通常以 “token 規模” 來進行計量,也就是客户查詢所使用和生成的天量數據量。

扎克伯格在 5 月與股東的電話會議上表示:“這絕對在考慮範圍內。幾乎每週都有不同的外部公司來找我們,既要求我們搭建專業的 API 服務體系,也詢問我們是否有他們可以從我們這裏購買的算力,並願意支付高於我們購入成本的溢價。”

扎克伯格當時表示:“我們還沒有這樣做,因為我們認為自己有用途可以使用這些算力。但顯然,如果我們到了某個階段,認為自己建設過度,那麼這就是我們擁有的一個選項,這也在一定程度上讓我們對投資建設這些基礎設施更有信心。

在快速演進的 AI 算力基礎設施軍備競賽中,扎克伯格曾多次暗示,他認為行業正受到 AI 算力容量約束,Meta 應儘可能多地積累算力,然後再決定其用途。

Meta 把 AI 雲變成 “算力回收飛輪” 的背後:Agent Runtime 爆發,半導體缺口與雲端 AI 推理算力需求共振上行

Meta 籌建 AI 雲業務的核心邏輯,是力爭把 “超級智能” 軍備賽形成的鉅額 ASIC/TPU/GPU、數據中心 CPU、數據中心電力鏈條和光互連網絡、存儲組件類昂貴算力資產,從單純內部成本中心轉化為可外部出租的 AI 算力基礎設施平台。

對資本市場而言,這等於給 Meta 數千億美元級 AI 資本開支裝上 “殘值回收機制”:自用時服務廣告推薦、視頻生成、AI 助手和超級智能訓練;閒置時變成 API、模型託管、推理集羣或 GPU 租賃龐大營收類別,從而緩解市場對 AI 資本開支回報率的焦慮。

AI 半導體交易主題的愈發槓桿化與倉位擁擠與蘋果等消費電子領軍者們漲價壓力升級,伴隨着費城半導體指數一度單日大跌 7.9%,且一個月內多次出現超過 5% 的劇烈波動,凸顯出與半導體相關聯的 AI 算力產業鏈已進入高波動、槓桿與看漲倉位極度擁擠、高預期兑現壓力階段,這也是為何近日不斷有機構投資者開始重點強調 “AI 半導體交易熱潮已經見底”、“AI 泡沫逐漸破裂” 這類過於悲觀的熊市敍事。

然而,華爾街知名投資機構野村週三發佈最新研報,反駁 “半導體見頂論”。野村反駁 “半導體見頂論” 的關鍵,不是簡單説 AI 芯片還會漲,而是指出 AI 雲基礎設施需求正在從單點 GPU 短缺擴散為系統性零部件錯配。按照野村研究框架,2026 年和 2027 年 AI 服務器營收預計分別增長 78% 和 76%,全球數據中心項目從 240 個增至 280 個,其中吉瓦級項目約 50 個,2027 年新增算力部署預計達 32GW,2028 年也已有 23GW 可見度;但真正瓶頸正在從 GPU 產能、台積電 CoWoS 先進封裝向晶圓級基板、AI PCB、覆銅板 (CCL)、電子布、MLCC、玻璃基板/ABF 基板、IC 載板、高端電容、電源管理芯片和數據中心光學類高速光互連元件外溢。

據悉,麥肯錫的中長期測算也支持野村上述強調這一方向:即到 2030 年,僅為滿足 AI 相關需求,全球算力價值鏈就需要向數據中心投入約 5.2 萬億美元,對應約 156GW 的 AI 相關數據中心容量需求。 這意味着半導體交易的主線不是 “見頂”,而是 “短缺部位輪動”:從 GPU 到 HBM,從先進封裝到基板材料,再到電力、液冷、網絡與雲調度軟件,盈利上修和漲價預期仍可能是 AI 算力相關核心硬件鏈條最強催化劑。

近日風靡全球的 “Agent Runtime” 理論則進一步解釋了為什麼雲端 AI 推理需求可能接近無止境。傳統模型託管是 “輸入—推理—輸出” 的無狀態服務,而智能體 AI 是循環式工作流:規劃、調用模型、調用工具、觀察、重試、糾錯,直到任務完成。最新的市場用例可謂非常關鍵:單次調用成功率即便有 95%,連續調用 15 次後的任務成功率也只有約 46.3%,這意味着企業真正購買的不是便宜 token,而是可編排、可觀測、可追蹤、可控成本、可審計結果的運行期系統。Nebius 所強調的從超過 200MW 運行算力邁向年底 800MW 至 1GW、並鎖定 3GW 以上預留容量,反映的正是雲基礎設施從 “賣 GPU 小時” 轉向 “賣結果確定性” 的升級。國際能源署也預計全球數據中心用電到 2030 年將翻倍至約 945TWh,這説明 Agent Runtime 不是單純軟件架構變化,而是會反向牽引 GPU 集羣、電力容量、網絡交換、存儲檢索、模型路由和可觀測性平台的全棧投資。

Meta 進軍雲計算背後可謂是 Agent Runtime 飛輪大爆發,半導體缺口與雲端 AI 推理算力需求共振上行。需求端由智能體任務循環放大 token 與推理消耗,供給端由先進封裝和小零部件瓶頸限制 AI 服務器交付,商業端則由 Meta、CoreWeave、Nebius、AWS、Azure 和谷歌雲爭奪 “可用 AI 算力” 的貨幣化入口。AI 雲計算不再只是傳統雲廠商的 IaaS CPU 與調度軟件擴容敍事,而是進入 “算力資產證券化 + 推理經濟學 + 半導體漲價鏈” 的複合週期;最受益的資產通常不是單一 GPU 敍事,而是同時具備供給瓶頸、定價權和現金流可見性的環節。