Can fold paper and also slam dunk! Google releases a large model for robotic bases, significantly enhancing the versatility of robots

華爾街見聞
2025.03.13 03:39
portai
I'm PortAI, I can summarize articles.

3 月 12 日,谷歌旗下的 DeepMind 公司發佈了全新的 AI 模型,利用其 Gemini 2.0 語言模型,專門訓練了用於控制機器人的模型。 環境適應能力、指令理解能力、操作靈活性都大大提升。

通用型機器人發展史上的又一個 “里程碑” 來了。

3 月 12 日,谷歌旗下的 DeepMind 公司發佈了全新的 AI 模型,名為 Gemini Robotics 和 Gemini Robotics-ER。 這套模型號稱能讓機器人更好地適應複雜環境,完成各種高難度任務。

截至昨日,谷歌母公司 Alphabet Class C 股價收盤小幅上漲 1.82%,收於 169.00 美元。

機器人也能摺紙、整理桌面、灌籃? 谷歌 DeepMind 展示不俗實力!

DeepMind 這次發佈的 AI 模型進一步升級,經過新模型訓練的機器人,不僅能流暢地摺疊紙狐狸。

還能按照語音指令整理桌面。

甚至還能熟練地拉開拉鍊。

最後還能來個迷你籃球灌籃!

DeepMind 還和初創公司 Apptronik 合作,計劃用這項技術打造人形機器人。

X 網友表示未來機器人管家真的不是夢了,想喝咖啡讓機器人幫忙做一杯。

以往,機器人的動作都需要科學家手動編程,費時費力。現在,得益於新的 AI 技術,機器人能更好地適應環境,學習新技能的速度也大大加快。Google DeepMind 的首席軟件工程師 Kanishka Rao 表示:

Gemini Robotics 的通用性是之前最好模型的兩倍,真正實現了向通用型機器人的重大飛躍。

Gemini Robotics:讓機器人更聰明、更靈活

據悉,Google 利用其 Gemini 2.0 語言模型,專門訓練了用於控制機器人的模型。這使得機器人擁有了三大 “超能力”:

  • 環境適應能力: 能快速適應各種新情況。
  • 指令理解能力: 能迅速響應口頭指令或環境變化。
  • 操作靈活性: 擁有足夠的手部靈巧性來操作物體。

這種能力對於機器人技術的發展至關重要,因為機器人之前在實驗室表現出色,但在非受控環境下往往 “水土不服”。

X 網友評論 Gemini 讓機器人變得更酷更有趣了。

加州大學伯克利分校的機器人學教授 Ken Goldberg 表示:

這項技術無疑是機器人領域令人興奮的進展,似乎建立在谷歌在大規模數據和計算方面的優勢之上。

他還提到,這些新機器人模型最獨特的地方在於它們可以在雲端流暢運行,這大概是因為它們能夠利用谷歌對需要大量計算能力的超大型語言模型的訪問。麻省理工學院教授,同時也是豐田研究院機器人研究副總裁的 Russ Tedrake 認為:

Gemini 是重要的一步。

但他也表示:

通用型機器人要做好投入使用,還有很多工作要做。

科技巨頭爭相佈局,萬億市場蓄勢待發

這次 DeepMind 的動作,也預示着一場機器人領域的 “軍備競賽” 正在加速。

美銀分析師 Ming Hsun Lee 團隊大膽預測,人形機器人即將告別概念驗證階段,在十年內迎來多行業應用爆發期。預計到 2030 年,全球人形機器人年銷量將達到 100 萬台,到 2060 年,人形機器人總保有量將達到 30 億台,相當於屆時人均擁有 0.3 台機器人。

包括特斯拉、OpenAI 在內的科技巨頭,以及眾多初創公司,都在爭先恐後地研發 AI“大腦”,希望賦予機器人自主操作的能力。

英偉達的 CEO 黃老闆更是直言,這項技術將帶來一個價值數萬億美元的巨大市場,甚至可能 “開創有史以來最大的科技產業”。