
谷歌 DeepMind 重磅報告:從 AGI 到 ASI,世界可能進入"連續爆炸"時代
谷歌 DeepMind 發佈《From AGI to ASI》報告,探討 AGI 實現後向超級智能 ASI 的進化路徑。報告定義 AGI 為具備人類中位數認知能力的系統,ASI 則需超越數萬專家協作十年的水平。文章指出數字智能在速度、記憶及複製等方面具優勢,並引入 AIXI 理論框架以理解機器智能極限。
谷歌 DeepMind 放出一篇重量級報告,題目叫《From AGI to ASI》,作者陣容堪稱豪華,包括 Shane Legg(Google DeepMind 聯合創始人兼首席 AGI 科學家)、Marcus Hutter(曾任 Shane Legg 的博士生導師,DeepMind 高級研究員,提出 AIXI 理論,首個嚴格的通用人工智能數學模型)等一眾理論大牛。這篇報告不是討論 AGI 能不能實現,而是直接跳過這個問題,探討一旦 AGI 實現之後,AI 會怎樣繼續進化,一直走到超級智能 ASI。
AGI 和 ASI 到底怎麼定義
報告裏給出了相對口語化的定義。AGI 指的是和單個人類差不多聰明的系統,在大多數認知任務上達到人類的中位數水平。ASI 則要嚴格得多,作者把門檻設得很高:一個 ASI 系統,要在幾乎所有任務和領域上,超過由數萬名專家組成、協作十年的人類團隊所能達到的水平。換句話説,AlphaFold 或 AlphaGo 這種在單一領域超越人類的系統,根本算不上 ASI,因為它們不夠通用。
報告還引入了一個理論上的終點概念,叫通用人工智能 Universal AI,也就是 AIXI 框架。這是一個數學上定義清晰但無法真正實現的 agent,它在所有可計算的環境和任務上都是最優的。報告強調這只是理論上界,真實的 ASI 會比它弱很多,但 AIXI 能幫助我們理解機器智能的極限在哪裏。
數字智能相比人類的幾大優勢
報告列出了一系列數字智能天生具備、且會隨着算力增長而不斷放大的優勢。包括輸入輸出速度,機器可以在幾秒內讀完幾本書;內部處理速度,可以通過更多算力變得更快;工作記憶容量,能記住互聯網的大部分內容;基底獨立性,程序可以在不同硬件之間遷移;無損複製,可以完整複製代碼和記憶狀態;以及高帶寬的經驗共享,可以在羣體之間分享學習信號。
這些優勢疊加起來,意味着 AI 系統的"社會"形態可能和人類社會完全不同。報告裏舉了幾種可能的形態,有點像科幻設定:可能是類似星際迷航博格集合體那樣高度同質化、緊密協作的超級羣體,也可能是市場化的、異質化的專家組成的流動組織。
ASI 不是無所不能的
報告專門強調,即使 AI 遠遠超過人類智能,也不代表它就是全知全能的。表格裏列出了一系列基礎限制,包括物理學限制比如光速和蘭道爾原理,實時性限制比如複雜動力系統無法被快速模擬,物理操控的限制比如改造物質需要時間和能量,以及複雜性理論和邏輯學上的限制比如哥德爾不完備定理和停機問題。這些限制意味着像徹底治癒衰老、用納米機器人重塑物質、上傳人腦、建造戴森球、恢復工業革命前的氣候這類設想,目前都無法被 ASI 保證實現。
四條通往 ASI 的路徑
報告的核心部分討論了四條可能的技術路徑,強調它們並不互斥,很可能同時發生。
第一條是擴大算力、模型和數據規模。過去十年 AI 的進步主要靠這個,性能大致按照冪律隨參數、數據和算力增長。但這條路徑面臨一個近在眼前的瓶頸:高質量文本數據可能會在這個十年內耗盡。報告認為,測試時計算產生的數據、模擬環境生成的數據,以及智能體交互產生的數據,有可能彌補這個缺口,但目前還不確定。
第二條是算法範式轉變。當前範式是用大型 transformer 通過最小化對數損失進行預訓練,再經過微調和測試時擴展。報告認為單純擴大這個範式不足以達到 AGI,社區正在嘗試加入近乎無限的上下文、持續學習能力,以及更穩健的決策能力。真正的範式轉變,比如轉向脈衝神經元和神經形態硬件,或者轉向以強化學習為基礎的預訓練,目前很難預測,但不應被忽視。
第三條是遞歸自我改進。報告把這種改進分成四種類型,類比人類的進化過程:基因層面的改進對應代碼、架構、優化器的自我修改;文化層面的改進對應 AI 自己生成、整理訓練數據,比如 AlphaZero 式的自我對弈和蒸餾;合作層面的改進對應通過專業化分工提升整體效率。報告認為,如果 AI 能完全自主地進行 AI 研究,可能帶來超指數級增長,也就是所謂的智能爆炸。但即便是數字研究者,也仍然受限於實驗運行所需的時間,尤其是涉及物理世界的實驗。
第四條是多智能體協調與羣體智能。大量 AGI 智能體可能組成具有自身代表性和動機狀態的"羣體智能體",類似全自動化的公司。這種協調可能是集中式的,也可能是市場化的去中心化的,比如所謂的虛擬智能體經濟。報告認為,無論哪種組織形式,集體智能很可能會隨着智能體數量和算力增長而擴展,這可能會形成所謂的"多智能體規模法則"。
六大潛在瓶頸
報告同時列出了一系列可能拖慢甚至阻斷進展的摩擦因素。
數據牆問題前面已經提到。經濟與資源需求增長過快,是指持續擴大規模所需的投資、芯片供應鏈、能源等資源可能跟不上,報告還特別提到太空數據中心這類替代方案,但同時也帶來臭氧層損耗、軌道擁堵等新風險。神經網絡範式本身可能不夠,大型預訓練 transformer 加後訓練加測試時擴展這套組合,可能根本無法達到 AGI,需要根本性的範式轉變。研究本身會越來越難,隨着領域成熟,低垂的果實被摘完,繼續進步需要的投入會指數級增長,但如果 AI 能自動化研究本身,這個問題可能會被抵消。
抽象壁壘是報告裏一個比較新顏的概念,由作者之一 Lerchner 提出。核心論點是,今天的 AI 系統主要從人類已經產出的概念和知識中學習,它擅長在人類已經定義好的概念框架內重新組合,但缺乏從零開始發現全新概念的機制。報告舉了一個例子:如果把一個現代基礎模型放在前牛頓時代的科學知識上訓練,即便給它同樣海量的數據,它也很難推導出廣義相對論。如果這個壁壘真實存在,那麼真正的 ASI 需要具備從原始高維數據中提煉全新概念的能力,而這種概念必須通過物理世界的實驗來驗證,這又引出了一個所謂的"具身瓶頸",意味着智能增長的速度可能會被現實世界的實驗速度所限制。
最後一個瓶頸是主動減速,包括監管、治理和社會反彈。報告認為隨着 AI 影響變得越來越明顯,社會可能會要求對 AI 研發本身設限,但這又和國家間的經濟軍事競爭壓力形成對沖,後者可能會推動各方繼續搶跑。
創造力和 ASI 的目標
報告還討論了一個有趣的問題:超級智能是否意味着超級創造力。引用了 Margaret Boden 對創造力的分類,把創造力分為三個層級:組合式創造力,把已有元素用新方式組合;探索式創造力,在已有概念空間內找到新東西,比如 AlphaGo 著名的第 37 手;變革式創造力,創造全新的概念空間,比如相對論或量子力學。報告指出,目前 AI 的成就大多停留在前兩個層級。DeepMind CEO Demis Hassabis 曾提出一個測試標準:如果把一個 AI 系統放回 1900 年愛因斯坦所處的環境,給它同樣的信息,它能否獨立推導出廣義相對論。報告認為目前答案顯然是不能。
關於 ASI 可能追求什麼目標,報告提到了工具趨同的概念,也就是無論最終目標是什麼,系統都傾向於追求資源獲取、效率提升和自我保存這類通用子目標。報告同時提到了一種替代性的目標設定,叫"知識尋求"目標,即最大化信息增益,這種目標在理論上具有一些有利特性,比如不容易陷入自我欺騙、不會停滯、傾向於避免不可逆的改變,並且因為知識是非競爭性的、正和的,所以更容易促成合作。
結論
報告的整體判斷是,如果 AGI 真的實現,AI 進步剛好停在人類水平這個點上的可能性不大。即便單個模型的能力停滯,只要有效算力還在增長,把大量 AGI 實例組織成集體或市場,集體能力很可能繼續提升。報告認為,與其把 AGI 的到來想象成一次性的轉折點,更可能的情況是一系列由 AI 驅動的科學和技術突破,在未來很多年裏持續不斷地衝擊社會的各個層面。
本文來源:AI 寒武紀
