Morgan Stanley: Visual data determines the future of AI, Tesla stands at the forefront of the "photon race"

智通財經
2025.09.24 09:41
portai
I'm PortAI, I can summarize articles.

摩根士丹利最新研報指出,特斯拉、Meta 和 Figure AI 等公司正在積極佈局視覺數據的收集與利用,形成一場針對現實世界視覺數據的 “光子競賽”。該行給予特斯拉 “增持” 評級,目標價 410 美元,強調視覺數據在 AI 訓練中的戰略價值。特斯拉計劃轉向 “純視覺” 訓練,利用人類視頻學習自主完成任務,標誌着其訓練範式的重大調整。

智通財經 APP 獲悉,摩根士丹利在最新研報指出,隨着多家企業將資源和注意力轉向物理/具身 AI 與機器人技術,一場針對現實世界視覺數據的 “光子競賽” 正在悄然爆發。在這一背景下,該行給予特斯拉 “增持” 評級,目標價 410 美元。

特斯拉、Meta 和 Figure AI 等公司正通過不同路徑積極佈局視覺數據的收集與利用。該行強調:“你可以擁有世界上所有的計算資源,但若沒有視覺數據,就無法訓練視覺 - 語言 - 行動模型(VLA)。” 大摩指出,視覺數據已成為 AI 訓練中最稀缺、最具戰略價值的資源。

大摩通過一個生動的比喻闡明視覺數據的價值:一條 600 磅的藍鰭金槍魚在遠離海岸的地方遊弋,若沒有漁船和漁具,其價值為零;但若具備捕撈能力,其價值可能高達 310 萬美元。同理,世界的視覺數據若無法被捕獲和處理,其價值也為零;但若能大規模收集並處理海量數據,則其價值將不可估量。

特斯拉:轉向 “純視覺” 訓練

2025 年 5 月,特斯拉前 Optimus 負責人發佈了一系列視頻,展示 Optimus 通過人類視頻學習自主完成任務。這些視頻以第一人稱視角 (攝像頭位於演示者身上) 拍攝,但最終目標是轉向通過 “隨機攝像頭” 和互聯網視頻獲取的第三人稱視角。

“特斯拉據稱將轉向 ‘純視覺’ 方法預訓練 Optimus,不再使用穿戴動作捕捉服與 VR 的遙操作員,改為錄製工人執行任務的視頻作為訓練數據。”

這一轉變標誌着特斯拉在訓練範式上的重大調整,凸顯出視覺數據在機器人行為模仿與泛化能力中的核心作用。

該行預計,未來視覺數據將不僅用於訓練模型,更將用於構建 “機器人訓練健身房”(模擬環境),從而在數字世界中迭代數十億種場景。特斯拉車主在駕駛時不僅在物理空間中移動,也在 “玩電子遊戲”,向模擬世界輸送數據以訓練最新 FSD 模型;Meta 眼鏡用户在教模型如何彈鋼琴、織毛衣、倒咖啡或倒垃圾。

大摩強調,視覺數據是訓練下一代 AI 模型的核心資源,其價值正在被重新定義。特斯拉、Meta 和 Figure AI 等公司通過不同的路徑推進數據收集戰略,從車輛、眼鏡到房地產,無一不在爭奪這場 “光子競賽” 的領先地位。