
Cloud vendors compete for the AI foundation

切走最厚的蛋糕。
作者 | 周智宇
編輯 | 張曉玲
當全世界還在爭論大模型是否只是一個昂貴的 “泡沫” 時,金山雲高級副總裁劉濤表示,這不是泡沫。
支持他論斷的,是正在發生的 “Vibe Coding(沉浸式開發)” 熱潮——當 Claude Code 已經可以熟練地用自己寫的代碼來迭代自身時,機器人造機器人、代碼寫代碼的 “奇點” 已經真實地觸碰到了產業界的脊樑。
面對這個變化,金山雲出招了。1 月 21 日,金山雲宣佈智算平台 “金山雲星流” 全面升級,其不僅包含了覆蓋模型全生命週期的訓推平台,還正式發佈了機器人平台和模型 API 服務。
這家老牌雲服務商正試圖通過身份的自我重塑,積極投身這場關於未來生產力主導權的角逐。
過去一年,智算需求持續增長,主要推手已從頭部企業的訓練需求,悄然轉向了推理側的爆發。
數據非常直觀,火山引擎日均 Token 調用量已衝上 50 萬億大關;豆包、千問、元寶等模型的外溢需求正以不可思議的速度擴張。這種爆發式的 Token 消耗,本質上是 AI 落地現實場景的過程。對於企業而言,大模型不再是 PPT 裏的點綴,而是實打實的降本增效工具。
“我們一直在關注推理什麼時候爆發,這種增速超過了過去所有 IT 基礎設施的認知。” 金山雲助理總裁孫曉感慨道。
在這種背景下,金山雲將自己定位為工程化的陪伴者,其邏輯非常純粹:既然大模型正成為萬物互聯的 “大腦”,那麼雲廠商就需要提供配套的 “循環系統”——穩定、高效且具備極致性價比的 Token 服務。
金山雲走的是一條 “任務驅動” 的邏輯演進路線。2023 年,行業主題是 “大規模智算網基礎設施建設”,比拼的是對底層異構資源的管理能力。2024 年,重點演進為 “平台化和 Serverless(無服務器計算)”,核心是將資源交付轉變為任務交付。而到了 2026 年,升級後的 “金山雲星流平台” 則錨定了三個核心主題:追求效率提升、構建行業平台、加速推理落地。
這種轉變在於,智算時代的訓練任務極其脆弱,在大規模算力集羣下,任何一點硬件波動都可能導致整個訓練任務的中斷。為了解決這個 “釘子”,金山雲自研了一套基於故障感知的自愈技術。
這套系統能針對硬件故障和軟硬結合故障進行分級處理。有些故障重啓即可,有些則需立即啓動替換策略。孫曉透露,這套機制可以實現 “秒級感知” 和快速處理。這意味着,即便底層硬件出現波動,客户的一輪訓練任務也能在不中斷的情況下平穩度過。
具身智能,是金山雲眼中智算雲的 “下半場”,也是金山雲重點關注的未來。
無論是自動駕駛還是人形機器人,行業目前仍處於一個 “混沌場景” 中,百花齊放但痛點固化。不同廠商有的關注大腦,有的關注小腦,有的則卡在數據仿真上。
金山雲發佈的 “金山雲星流機器人平台”,試圖打通從數據採集、存儲、標註到模型訓練、部署與仿真的全鏈路閉環。孫曉認為,機器人場景需要解決的是 “從算法研發到真實場景部署” 的落地難題。
以自動駕駛為例,模型在車端,但訓練在雲端,這對算力密度的要求或許沒那麼高,但對顯存和多模態點雲數據的處理能力要求極高。金山雲通過構造閉環的數據平台,讓客户能更便捷地接收、處理這些海量數據。
劉濤在展望未來時描繪了一個畫面:2026 年起,家庭場景機器人將逐步落地。從最初幫老人撿襪子、撿毛巾,到最終輔助生活,這是一個跨度長達 5 到 10 年的萬億賽道。而金山雲要做的,就是成為這個萬億賽道的 “底座” 和 “引擎”。
隨着傳統公有云市場進入存量博弈,智算雲正帶來全新的增長機會。金山雲能夠在去年三季度實現 120% 的同比增速,本質上是因為它抓住了這一波生產力重構的機會。
堅持 “不做大模型” 的承諾,反而讓金山雲在生態建設上變得極度開放。孫曉坦言,他們的職責是基於開源模型,依託自研技術,提供最穩定、最高性價比的 Token 服務。業內熱門模型一發布,金山雲當天就能上線推理服務,這種響應速度在行業內也處前列。
在智算時代,配套產品正在發生劇變。過去是計算、存儲、網絡,現在則是以推理加速為核心的技術棧(包括引擎、算子優化),以及圍繞 Agent(智能體)構建的生態。金山雲正通過 PD 分離(預填充和解碼分離)以及量化技術,極致壓低推理時延,提升吞吐性能。
甚至在某些爆款遊戲的背後,金山雲也在提供全棧雲服務。在重負載、高併發的開服階段,金山雲通過平台化 + 工程師重保的機制,平穩支撐了海量玩家的湧入。這種從遊戲重保中沉澱下來的極限壓測經驗,正被移植到大模型推理的戰場上。
過去十年的雲市場,是一場關於資源規模的博弈,雲廠商扮演的是類似水電煤的 “公用事業” 角色。到了 2026 年,技術端的 “內卷” 仍將繼續。從更大的參數量到更先進的計算方式(如 MLA 或線性 Attention),國內的大模型廠商依然在瘋狂追求效率的極限。
但真正的分水嶺在於 “應用”。視頻生成的實用化、VLA 模型在車端與機器人端的泛化、以及 Agent 在老百姓日常生活中的滲透,將讓推理需求呈現指數級增長。
智算雲的紅利期不會永遠持續,只有那些能解決極限工程難題、能打通行業數據閉環、能提供極致性價比 Token 的廠商,才能在潮水退去後依然立於潮頭。
“我們已經打下了良好的客户基礎,未來 3 到 5 年,金山雲會有一個顯著的變化。” 劉濤信心滿滿。
當智算的齒輪加速轉動,這場關乎生產力主導權的競賽,才剛剛進入最殘酷、也最精彩的深水區。
