How AI Videos Say Goodbye to "Gacha" Games

華爾街見聞
2026.01.14 07:43
portai
I'm PortAI, I can summarize articles.

大語言模型普遍面臨商業模式 “撞牆” 的焦慮期,AI 視頻模型已率先跑通了現金流。

2025 年第二季度,快手 “可靈” 營收超 2.5 億元,MiniMax 的 “海螺” 2025 年前三季度亦創收 0.17 億美元。

而在近期,正在衝刺港股 IPO 的羣核科技旗下首個 AI 視頻生成應用 LuxReal 啓動內測,試圖在這一吸金賽道中尋找差異化路徑。

商業化方面,LuxReal 瞄準了具備更強付費意願的海外電商和短劇的專業用户市場。

技術路徑上,則依託羣核科技的 3D 結構化場景數據,提出了一種 “拒絕猜像素” 的新路徑:通過 3D 建模與視頻算法的雙重保險,降低抽卡概率,增強空間一致性。

儘管行業正駛向商業化,但 “不可控性” 使得大多數產品只能停留在 “抽卡遊戲” 階段,無法滿足 B 端交付中對物理邏輯和細節連貫的嚴苛標準。

“生成式模型根本不適合製作視頻,目前大家看到的能生成視頻的 AI 模型,並不能理解物理世界,它們只是在生成漂亮的圖片。” 圖靈獎得主楊立昆指出。

隨着 AI 視頻生成賽道的入局者愈多,行業或許有望探索更多新的技術路徑。

遠離 “猜像素”

Luxreal 模型的比較優勢,來自羣核科技在過去多年間構建的龐大且物理正確的室內空間數據集。

據羣核科技現場展示 Luxreal 生成的 DEMO 視頻中,人物跳舞中並未出現表情崩壞,鏡頭之間保持了一定的一致性。

目前羣核科技已擁有 5 億個 3D 結構化場景和 4.4 億商品模型的數據資產,成為了 “空間一致性” 的保障之一。

當前絕大多數主流 AI 視頻生成模型的核心技術邏輯是採取擴散模型和 Transformer 的融合來提升一致性。

以 OpenAI 旗下的視頻生成應用 Sora 為例,其技術路線可以理解為擴散模型與 Transformer 的深度融合,既有擴散模型 “通過逐步去噪過程從隨機噪聲生成高質量視頻,而非直接預測下一幀像素” 的技術優勢,還以 Transformer 的自注意力機制實現對時空維度的全局建模,解決了傳統逐幀生成的 “記憶衰減” 問題。

但空間一致性的實現,要求視頻中物體的位置、比例、形狀、紋理等可以在鏡頭移動、視角切換和場景變化中保持物理正確性,這對於當前的絕大部分 AI 視頻生成應用來説普遍存在挑戰。

李飛飛認為,人類認知很大程度依賴空間推理,但現有的 AI,哪怕是強大的多模態模型在空間理解上仍非常薄弱,例如不理解楚物體大小、位置和距離等。

整體來看,由於訓練的數據、算力、算法等方面的侷限性,AI 視頻模型難以理解當前的物理世界運動規律,更多時候是通過 “猜測” 的形式來完成對下一幀畫面的補齊,也就容易出現空間一致性的問題。

Luxreal 對此給出的解題思路,是在 AI 生成視頻之前先對主體進行真實的 3D 建模,試圖以此提升視頻中物體本身的一致性。

以前述 DEMO 視頻為例,視頻中的人物完成了真實的 3D 建模,這也使得其在運動畫面中保持了一致性。

“所以我們相當於在 3D 層面就對錶情做了第一重控制,在視頻算法層面再做第二重控制,兩層保險疊加能夠使得最後的視頻效果在動作等方面保持一致性。” 羣核科技產品經理龍天澤向信風表示。

但若缺乏 3D 建模環節,Luxreal 的空間一致性便要大打折扣。

根據信風參與 Luxreal 的內測,以一盒樂高搭建的向日葵作為圖片和 “Lego sunflower model in a cardboard box, showcasing vibrant flowers and green stems, under soft lighting with a warm atmosphere”(樂高向日葵積木模型置於紙盒之中,鮮豔的花盤與翠綠的花莖清晰呈現,柔和光線灑落,營造出温馨愜意的氛圍)作為提示詞描述,但最終呈現的效果出現了樂高積木懸空、紙盒被替換的問題。

一位 Luxreal 開發人員向信風表示,該產品仍需要持續優化。

冰火兩重天

AI 視頻生成模型的賽道曾一度不被巨頭所看好。

百度創始人李彥宏曾在 2024 年表示:“Sora 這種視頻生成的投入週期太長了,10 年、20 年都可能拿不到業務收益,那麼無論多麼火爆,百度都不去做。”

但新入局的玩家們確實用實打實的營收數據,打破了巨頭們的悲觀預期。

今年第二季度,快手旗下的 AI 視頻生成應用可靈已實現超過 2.5 億元人民幣的營收。

基於這一超預期的商業化表現,快手不僅在 2025 年三季度財報電話中上調了當年的全年收入預期,還追加了對算力的投入力度。

這同樣刺激了快手的股價表現,最近 6 個月累計漲幅已超過 20%。

近期剛上市的 MiniMax 亦在視頻生成應用賽道中嶄露頭角,其旗下的 AI 視頻生成應用 “海螺” 在 2024 年 8 月上線後迅速成為支柱業務,2025 年前三季度創收 0.17 億美元(合人民幣 1.2 億元),佔總收入比重高達 32.6%。

同期海螺付費用户數達到 31 萬,人均貢獻高達 56 美元,都充分證明用户對於 AI 視頻有着極高的付費意願。

2026 年 1 月 9 日,MiniMax 上市當天收盤報 345 港元/股,較發行價上漲 109%,市值突破千億港元。

營收數據的狂飆背後,極低的用户留存率正成為懸在所有玩家頭頂的達摩克利斯之劍。

當大眾對 “讓貓跳舞” 的新鮮感退潮,絕大多數 AI 視頻生成應用正陷入 “拉新容易留存難” 的泥潭。

以海螺為例,2025 年 10 月海螺在新加坡蘋果用户中的 1 天、7 天、30 天、60 天用户留存率分別為 22.57%、4.62%、0.8% 和 0.66%。

這意味着,海螺每拉新 100 個用户,在 60 天后只有不到 1 個用户會留在該應用中。

面對 C 端市場的留存挑戰,目前羣核科技給出的解法則還是偏向於海外的 B 端市場。

“目前針對的是海外市場,主要是海外電商、短劇等對視頻空間一致性有較高要求的用户。” 一位羣核科技內部人士告訴信風。

對於電商和短劇製作方等 B 端用户來説,視頻是直接關聯轉化率的 “工具”,其確實具備更強的付費意願。

但這部分人羣對於交付質量同樣具有更高的要求,Luxreal 能否在充滿不確定性的 AI 視頻賽道中,尋找一份屬於工具類產品的確定性,仍需經受真實商業環境的持續大考。