大摩:視覺數據重構 AI 機器人競爭格局 特斯拉為核心關注標的

智通財經
2025.09.24 13:36
portai
我是 PortAI,我可以總結文章信息。

摩根士丹利的研究報告指出,AI 機器人的競爭已從算法迭代轉向數據爭奪,視覺數據是 VLA 模型訓練的核心資源。特斯拉、Meta 和布魯克菲爾德等企業通過場景覆蓋和數據積累構建技術壁壘。隨着具身人工智能技術的成熟,圍繞視覺數據的爭奪戰愈發激烈,能夠平衡數據收集效率、用户隱私與商業化的企業將有望重塑全球 AI 機器人產業格局。

智通財經 APP 獲悉,摩根士丹利的研究報告指出,AI 機器人的競爭已從 “算法迭代” 下沉至 “數據爭奪”,視覺數據作為 VLA 模型訓練的核心資源,其獲取能力將直接決定企業在行業中的地位。無論是特斯拉 (TSLA.US) 聚焦工業場景的視頻採集,Meta (META.US) 搶佔消費端穿戴設備入口,還是布魯克菲爾德激活不動產場景資源,本質都是通過 “場景覆蓋 + 數據積累” 構建技術壁壘。

隨着具身人工智能技術的成熟,“光子之爭” 將愈發激烈,而那些能平衡數據收集效率、用户隱私與商業化落地的企業,有望在這場競爭中脱穎而出,重塑全球 AI 機器人產業的格局。

報告主要觀點如下:

在人工智能、機器人技術加速迭代的當下,一場圍繞 “視覺數據” 的爭奪戰已悄然打響。摩根士丹利 9 月 22 日發佈研究報告,稱視覺 - 語言 - 動作 (VLA) 模型是 AI 機器人實現自主交互的核心,而訓練這類模型的關鍵 ——“現實捕捉數據”,正成為全球科技與製造巨頭爭奪的焦點。

從特斯拉 Optimus 機器人轉向純視覺訓練,到 Meta 在可穿戴設備中嵌入超高清攝像頭,再到布魯克菲爾德聯合 AI 企業佈局場景數據收集,“誰能大規模獲取高質量現實場景視頻,誰就能在 AI 機器人時代佔據先機” 已成為行業共識。

一、“光子之爭” 的本質:視覺數據是 AI 機器人的 “燃料”

大摩報告用 “胖金槍魚” 的比喻生動詮釋了視覺數據的價值邏輯:在偏遠島嶼上,一條 600 磅的藍鰭金槍魚若無法捕獲,其價值為零;唯有配備船、漁具與探測器,金槍魚才具備百萬美元級價值。視覺數據的價值亦如此 —— 若缺乏收集與處理能力,全球視覺數據的潛在價值無法釋放;而當企業掌握 “堯級次浮點運算 (10²⁴次 / 秒)” 的數據處理能力時,現實場景數據將成為 AI 機器人技術突破的核心 “燃料”。

這種認知正驅動企業將攝像頭部署到家庭、辦公室、汽車乃至人體穿戴設備中。摩根士丹利分析師在與 Figure AI(專注端到端生成式 AI 自動駕駛的初創公司) 聯合創始人亞歷克斯・肯德里克交流時,對方明確表示:“無論誰能大規模獲取家庭場景的超高清視頻…… 誰就能贏。” 這一觀點直指 AI 機器人發展的核心瓶頸 —— 高質量、多場景的視覺訓練數據稀缺。

二、特斯拉押注純視覺訓練,開啓機器人數據採集新路徑

作為 AI 機器人領域的關鍵玩家,特斯拉在視覺數據應用上的動作備受關注。報告披露,2025 年 5 月,特斯拉前 Optimus 項目負責人通過 X 平台發佈視頻,顯示 Optimus 已能通過 “人類演示視頻” 自主執行任務,這些視頻以第一視角拍攝,而長期目標是轉向 “隨機部署攝像頭捕捉的第三人稱視角”,這一轉型標誌着特斯拉從 “人工操控輔助” 向 “數據驅動自主學習” 的關鍵跨越。

更具突破性的是,《商業內幕》2025 年 8 月報道顯示,Optimus 的預訓練將徹底 “去人工化”—— 不再依賴穿戴動作捕捉服與虛擬現實 (VR) 的遠程操控人員,轉而通過 “錄製工廠工人執行任務的視頻” 獲取訓練數據。這種模式不僅降低了訓練成本,更能讓機器人學習真實工業場景中的複雜操作邏輯,提升實用價值。

無獨有偶,報告還提及未上市企業 Skild AI 的佈局:該公司正構建 “機器人基礎模型”,核心訓練數據正是來源於 “互聯網上的人類動作視頻”,進一步印證了 “現實場景數據” 在機器人訓練中的通用性價值。

三、巨頭競逐:Meta 搶佔穿戴設備入口

在消費端與場景端,科技與資產巨頭也在加速佈局視覺數據採集,形成多元化競爭格局。

1. Meta:可穿戴設備成 “數據戰場”,用户臉部承載關鍵價值

Meta 在下一代可穿戴設備上的佈局直指視覺數據收集。報告指出,Meta 計劃在眼鏡產品中嵌入 2 個超高清攝像頭,重點捕捉用户 “手部動作的現實數據”—— 無論是彈鋼琴、織毛衣,還是倒咖啡、倒垃圾,這些日常動作都將成為訓練 AI 機器人的珍貴素材。摩根士丹利預測,未來 2 年內這類設備的保有量或達 2000 萬台,接近當前全球特斯拉汽車數量的 2 倍。

每一位 Meta 眼鏡用户,都可能在 “數字宇宙的數十億個場景中” 訓練一個 “人形虛擬形象”。報告形象地稱:“這些眼鏡或許設計時尚,但你的臉,早已成為數據爭奪的 ‘戰場’。” 儘管 Meta 可穿戴設備目前仍處於 “概念驗證階段”,短期內難對財務產生實質影響,但摩根士丹利互聯網團隊強調,其 “全棧式佈局”(自主研發硬件 + AI 操作系統 + 內容生態) 已為搶佔下一代計算平台奠定基礎,而視覺數據收集正是這一佈局的核心環節。

2. 布魯克菲爾德:激活不動產資源,打造 “最大規模預訓練數據集”

不同於科技公司的設備端佈局,全球領先的基礎設施解決方案提供商布魯克菲爾德選擇 “以資產換數據”。報告披露,布魯克菲爾德近期與 Figure AI 達成合作,計劃開放其龐大的不動產版圖 —— 超過 100 萬套住宅單元、5 億平方英尺商業辦公空間、1.6 億平方英尺物流倉儲空間,用於 AI 機器人訓練數據的收集。

這一合作的核心價值在於 “場景多樣性”:住宅、辦公、物流等不同場景的環境特徵、物體佈局與人類活動模式,能為 AI 機器人提供多維度的訓練素材,幫助機器人學習在 “以人類為中心的各類場景” 中移動、感知與行動。目前,布魯克菲爾德旗下資產已啓動數據收集工作,未來數月將擴大規模;雙方還計劃探索 “在不動產中部署人形機器人” 的長期商業化機會,形成 “數據收集 - 模型訓練 - 場景落地” 的閉環。

四、投資視角:特斯拉為核心標的,關注數據生態鏈機會

摩根士丹利在報告中明確將特斯拉列為核心關注標的,給予 “增持” 評級,目標股價 410 美元。其中 AI 機器人相關的技術突破與數據積累,是支撐長期估值的關鍵變量。

報告同時提示了行業核心風險:一是傳統車企、中國車企及科技巨頭在 AI 機器人領域的競爭加劇;二是特斯拉多工廠投產與技術迭代的執行風險;三是全自動駕駛 (FSD) 搭載率、用户平均收入 (ARPU) 不及預期,導致市場對 “Dojo 超級計算機賦能服務業務” 的價值認可度下降。