大摩：视觉数据决定 AI 未来，特斯拉站上 “光子竞赛” 前沿

摩根士丹利最新研報指出，特斯拉、Meta 和 Figure AI 等公司正在積極佈局視覺數據的收集與利用，形成一場針對現實世界視覺數據的 “光子競賽”。該行給予特斯拉 “增持” 評級，目標價 410 美元，強調視覺數據在 AI 訓練中的戰略價值。特斯拉計劃轉向 “純視覺” 訓練，利用人類視頻學習自主完成任務，標誌着其訓練範式的重大調整。

智通財經 APP 獲悉，摩根士丹利在最新研報指出，隨着多家企業將資源和注意力轉向物理/具身 AI 與機器人技術，一場針對現實世界視覺數據的 “光子競賽” 正在悄然爆發。在這一背景下，該行給予特斯拉 “增持” 評級，目標價 410 美元。

特斯拉、Meta 和 Figure AI 等公司正通過不同路徑積極佈局視覺數據的收集與利用。該行強調：“你可以擁有世界上所有的計算資源，但若沒有視覺數據，就無法訓練視覺 - 語言 - 行動模型（VLA）。” 大摩指出，視覺數據已成為 AI 訓練中最稀缺、最具戰略價值的資源。

大摩通過一個生動的比喻闡明視覺數據的價值：一條 600 磅的藍鰭金槍魚在遠離海岸的地方遊弋，若沒有漁船和漁具，其價值為零；但若具備捕撈能力，其價值可能高達 310 萬美元。同理，世界的視覺數據若無法被捕獲和處理，其價值也為零；但若能大規模收集並處理海量數據，則其價值將不可估量。

特斯拉：轉向 “純視覺” 訓練

2025 年 5 月，特斯拉前 Optimus 負責人發佈了一系列視頻，展示 Optimus 通過人類視頻學習自主完成任務。這些視頻以第一人稱視角 (攝像頭位於演示者身上) 拍攝，但最終目標是轉向通過 “隨機攝像頭” 和互聯網視頻獲取的第三人稱視角。

“特斯拉據稱將轉向 ‘純視覺’ 方法預訓練 Optimus，不再使用穿戴動作捕捉服與 VR 的遙操作員，改為錄製工人執行任務的視頻作為訓練數據。”

這一轉變標誌着特斯拉在訓練範式上的重大調整，凸顯出視覺數據在機器人行為模仿與泛化能力中的核心作用。

該行預計，未來視覺數據將不僅用於訓練模型，更將用於構建 “機器人訓練健身房”（模擬環境），從而在數字世界中迭代數十億種場景。特斯拉車主在駕駛時不僅在物理空間中移動，也在 “玩電子遊戲”，向模擬世界輸送數據以訓練最新 FSD 模型；Meta 眼鏡用户在教模型如何彈鋼琴、織毛衣、倒咖啡或倒垃圾。

大摩強調，視覺數據是訓練下一代 AI 模型的核心資源，其價值正在被重新定義。特斯拉、Meta 和 Figure AI 等公司通過不同的路徑推進數據收集戰略，從車輛、眼鏡到房地產，無一不在爭奪這場 “光子競賽” 的領先地位。