
3 億刀,特斯拉 1 萬個 H100 集羣上線!超算 Dojo7 月已經開工,全力加速 L4 自動駕駛

特斯拉 10000 塊 H100 GPU 集羣上線,加速 FSD V12 落地。擁有自家超算的和 H100 集羣的特斯拉,正式入局算力軍備競賽!
根據特斯拉爆料人士 Sawyer Merritt 爆料,特斯拉將於美國時間本週一上線備受期待的,由 1 萬片 H100 組成的超級計算機。

這個 GPU 集羣將用來訓練包括特斯拉 FSD 自動駕駛系統在內的各種 AI 應用。
這個 GPU 集羣由一萬個英偉達 H100GPU 組成,能提供 340 FP64 PFLOPS 的峯值算力,為 AI 提供 39.58 INT8 ExaFLOPS 的峯值算力。
這個算力峯值超過了之前全世界排名第四的超算 Leonardo 所能提供的算力。

憑藉這台超級計算機,特斯拉可以迅速訓練並更新它的全自動駕駛(FSD)技術。
這個 H100 集羣不僅讓特斯拉相比其他汽車製造商更具競爭力,而且將使特斯拉擁有誇張的算力儲備。
馬老闆上個月甚至發推稱:「坦白説……如果英偉達能提供足夠的 GPU,我們可能就不需要 Dojo。」
特斯拉的算力儲備有什麼用?
而且對於特斯拉來説,這個 H100 集羣不單代表了無與倫比的算力,還使得擁有海量數據的特斯拉能將這些數據變現的能力。
特斯拉工程技術總監 Tim Zaman 發推稱,特斯拉上線的 H100 集羣,將被用於訓練視頻數據。
特斯拉擁有的訓練數據集可能是全世界最大的,熱連接緩存(hot tier cache)大小超過了 200PB,這比大語言模型的數據規模要高几個數量級!

同時他還稱,特斯拉是真正「物理上」擁有這些 GPU 集羣和算力。很多其他的公司宣稱自己「擁有」多大算力時,其實他們只是能「租到」這些算力。

而對於目前的特斯拉來説,上線 H100 集羣的意義就在於能夠極大地加快最新版 FSD V12 的上線速度。
馬斯克在兩個月之前稱,最新版的 FSD V12 版本更新將不再是「測試版」的自動駕駛技術,暗示了這次更新可能真的能帶來完全體的自動駕駛技術。

而就在前幾天,馬斯克自己開着特斯拉來了一場全網關注的 FSD V12 的演示直播。
直播中,新版的 FSD V12 展示出了「絲滑的自動駕駛性能」和出色的駕乘體驗。
FSD V12 背後的技術原理,就是將海量的優秀司機駕駛的實時視頻,通過神經網絡訓練成一個全新的自動駕駛 AI 來駕駛汽車。
特斯拉上線這個 H100 集羣后,將會大大加快 FSD V12 的訓練速度,這也被上文中特斯拉工程總監的帖子所證實。
馬斯克在推特上稱,V12 可能將在不到半年的時間內更新上線!

而除了特斯拉 FSD V12 之外,特斯拉的人形機器人 Optimus 也將從特斯拉儲備的巨大算力中獲益。

網友分析到,因為智能機器人的工作原理,本質上也是從視頻信號中去理解周圍的世界。這和自動駕駛的本質是一樣的,只是形態和控制方式有區別。
特斯拉超算 Dojo 怎麼樣了?
Tesla 上線 H100 GPU 集羣的同時,也在激活自己研發製造的超算 Dojo。下圖是特斯拉內部對 Dojo 計算能力的預測。
2024 年 10 月,Dojo 的計算能力也有望達到 100 exaflops。

在 2021 年的 AI Day 上,特斯拉第一次公佈了自己超算——Dojo。

快兩年時間過去了,在今年 7 月推特(現 X)科技爆料賬户 Whole Mars Catalog 爆料 Dojo 已經正式開始開始工作了。
這一消息也得到了馬斯克本人的點贊確認。

整個超算由這樣的計算模塊構成

每個模塊上有 25 個 Soc,模塊之間通過高速寬帶連接。

然後將模塊用主機盒固定起來,所有的接口都集成在了系統托盤上。

然後將兩個帶有主機組件的系統托盤安裝到一個 Dojo 機櫃中。

頂部的圖例展示的是每個 Soc 的負載。
而現在,擁有 Dojo 和 1 萬塊 H100 集羣的 Tesla,正式加入了算力軍備競賽當中。
本文來源:新智元,原文標題:《3 億刀,特斯拉 1 萬個 H100 集羣上線!超算 Dojo7 月已經開工,全力加速 L4 自動駕駛》
