谷歌這一年:從恐慌到豪賭,All In AI 大戰

華爾街見聞
2023.12.17 08:35
portai
I'm PortAI, I can summarize articles.

下一步,谷歌需要把 Gemini 大模型整合進旗下產品,同時又不蠶食搜索等現有業務份額。

今年年初 OpenAI 的崛起令全球震驚,而微軟將 ChatGPT 嵌入必應更是令谷歌倍感威脅,谷歌是如何用一年時間在 AI 競賽中重新站穩腳跟?

根據媒體發佈的一篇文章,這家科技巨頭首先平息內鬥,合併兩大人工智能部門,其次加速研發 AI 模型,推出多模態模型意圖趕超 OpenAI,最後憑藉在芯片、模型框架等全方位佈局,推出強大的 Gemini 模型開始反攻。

現在,谷歌走到了最困難一步——將 Gemini 大模型整合進旗下產品。

以下為華爾街見聞編譯的原文:

不管是谷歌還是其他公司,這都是一個值得回顧的時刻,他們顯然戰勝了那些末日論者。

上週,谷歌發佈了備受期待的新人工智能模型 Gemini,而在此近一年前,一些評論家曾預測 OpenAI 的 ChatGPT 可能會挑戰谷歌在搜索領域的領導地位。谷歌積極應戰 OpenAI,領導層設法讓公司內部相互競爭的部門開始合作,共同制定應對方案,從而擊退了那些認為谷歌變得過於優柔寡斷和官僚主義的人。如今谷歌在搜索領域的主導地位依舊,就連其股票也在今年一路上漲。

現在艱苦的工作開始了,在接下來的幾個月裏,谷歌必須證明自己能夠將 Gemini 整合到旗下的產品中,同時又不蠶食搜索等現有業務份額。

該公司已經將一個簡化版本的 Gemini 應用到 Bard 中,該聊天機器人是該谷歌為與 ChatGPT 競爭而創建的,但迄今為止使用率似乎有限。兩位熟知內情的人士説,未來,該公司計劃將 Gemini 應用於幾乎整個產品線,從搜索引擎到生產力應用軟件,以及 Pixel 設備獨有的 AI 助手 Pixie。據一位瞭解內部討論情況的人士説,產品還可能包括可穿戴設備,比如眼鏡,它可以利用人工智能識別佩戴者看到的物體的能力,然後該設備可以向佩戴者提供建議,比如如何使用工具、解決數學問題或演奏樂器。

谷歌在做這些事情的同時,還必須小心翼翼地與監管機構周旋。該公司正處於兩場關於其搜索引擎和廣告業務的反壟斷鬥爭中。反壟斷官員正密切關注谷歌的人工智能工作,並將其視為谷歌如何利用在某一領域的優勢在另一領域取勝的範例。在這種情況下,谷歌利用其搜索中的網站數據以及數十億客户的數據來訓練新的人工智能。

人工智能的成功對於谷歌的雲計算業務也至關重要,對計算要求極高的人工智能模型正在激發對雲服務的需求。微軟與 OpenAI 建立了緊密的合作關係,其雲業務的增長速度已經超過了谷歌和亞馬遜。

雖然 ChatGPT 因其對話式 AI 而聞名,但其背後的技術已被證明在整個商業領域都非常有效,從自動化客户服務和軟件編碼,到快速生成營銷方案,以及幫助華爾街公司理解大量數據。谷歌面臨的問題是,OpenAI 和微軟在向消費者和企業銷售這項技術方面已經佔得先機,為他們提供了寶貴的數據和反饋,他們可以利用這些數據和反饋來改進產品。

“只有親⾃試了之後,才能夠判定是人們能用它創造出什麼,我們才剛剛開始看到這一點,但已經看到的是非常了不起”,Madrona Venture Group 的合夥人 Jon Turow 指出,他曾在亞馬遜雲計算部門負責人工智能產品。

Gemini 是谷歌 25 年曆史上投入最大的努力之一,隨着谷歌步入中年,其核心廣告業務繼續創造鉅額利潤,這也為其母公司 Alphabet 在自動駕駛汽車、健康保險和生物技術等新業務上的一系列押注提供了資金,但是這些下了十年的賭注都沒有得到回報。

因此,越來越多的投資者要求谷歌領導層削減 18.2 萬人的成本,今年的大規模裁員打擊了員工士氣。同時,谷歌正準備在新的一年裏進行更多的裁員,但目前還不清楚裁員的範圍是廣泛的還是針對特定羣體。

人工智能是另一個賭注,需要公司投入鉅額資金,支付從人員到硬件的一切費用。一位與 Gemini 團隊關係密切的人士表示,谷歌需要投入巨資來抵禦人工智能團隊向 OpenAI 倒戈的威脅。

谷歌還選擇了一種特別昂貴的技術方法,即設計自己的人工智能芯片。這一決定使谷歌在硬件上獨立於英偉達,後者是人工智能服務器芯片的主要供應商。OpenAI 等競爭對手依賴於英偉達和其他公司生產的硬件。

谷歌還希望消除人們對它的看法,即它的成果不過是靠幾十年前的創新成果。多年來,谷歌通過 Google Brain 和 DeepMind 兩個獨立的部門為人工智能研究投入了大量資金。谷歌甚至還發明瞭 transformer 的底層技術,該技術是 OpenAI 創建的 GPT 系列人工智能模型的核心。

但是,OpenAI 的崛起讓人們擔心,谷歌可能會像之前的許多其他老牌科技巨頭一樣,在技術上失去領先地位。據一位直接瞭解谷歌與微軟討論情況的人士透露,在谷歌內部,微軟在今年 2 月將 ChatGPT 納入必應搜索引擎,這讓谷歌的高管們尤其感到不安。

谷歌發言人未就此事發表評論。

AI 部門內鬥

多年來,谷歌和 Alphabet 的首席執行官桑達爾 - 皮查伊一直向同事抱怨,他無法讓旗下的兩個人工智能研究部門進行合作。谷歌 2014 年收購了 DeepMind,該公司首席執行官 Demis Hassabis 長期以來一直堅持獨立於母公司,他認為這樣的安排可以讓公司更好地實現開發通用人工智能的目標。

與此同時,DeepMind 的姊妹部門 Google Brain 專注於研究如何將 AI 應用於谷歌的產品,並孵化了機器學習領域的重要進展,如 transformer,這一發明為谷歌和其他公司訓練更復雜的模型鋪平了道路。該部門由 Jeff Dean 領導,他是一名資深工程師,在谷歌成立初期,他的編碼工作幫助谷歌將搜索引擎擴展到數十億用户。

兩個部門之間的分歧很深,Google Brain 的總部位於加州山景城的谷歌總部,而 Hassabis 和他的團隊則在倫敦國王十字車站附近的辦公室。

一位曾在 DeepMind 工作過的人士説,隨着公司規模的擴大,DeepMind 不遺餘力地避免與谷歌大腦合作。例如,在谷歌大腦當時沒有主要業務的城市,如巴黎和阿爾伯塔省的埃德蒙頓等地開設辦事處。DeepMind 的研究人員可以訪問 Google Brain 編寫的代碼,但反之不行。一些員工認為這是 DeepMind 過度保密的表現,甚至在谷歌員工中也是如此。當 Hassabis 想採取措施保持 DeepMind 的獨立性時,他會直接與聯合創始人 Larry Page 溝通,後者與聯合創始人 Sergey Brin 一起主導了收購,並擁有 Alphabet 的控股權。

一位知情人士説,隨着時間的推移,Hassabis 希望將 DeepMind 與谷歌更徹底地分開,因為他越來越擔心這家龐大的公司會如何使用這項技術,包括將其出售給軍方。他萌生了創建一家獨立公司的想法,該公司將擁有 DeepMind 的知識產權。但在 2021 年,Hassabis 告訴 DeepMind 的員工,在皮查伊承諾向該公司提供更多資金用於包括人工智能倫理在內的目的後,脱離谷歌的努力已經結束。

多年來,對資源的爭奪加劇了兩家公司之間的緊張關係。谷歌向其人工智能研究人員發放的服務器芯片數量有限。隨着全行業對人工智能的狂熱促進了對芯片的需求,這些芯片變得更加稀缺。

與此同時,隨着谷歌高管深陷內部政治泥潭,公司的著名人工智能研究人員也開始紛紛出走。其中一些人成立了自己的公司,他們對谷歌的官僚文化感到沮喪,因為在 OpenAI 推出類似 ChatGPT 的服務之前,谷歌的官僚文化早已阻礙了 ChatGPT 的發佈。還有一些人則被 OpenAI 收購,OpenAI 是馬斯克和其他知名人士於 2015 年以非營利形式創辦的一家初創公司,部分原因是他們擔心谷歌將擁有人工智能的未來。OpenAI 的創始人之一是 Ilya Sutskever,他是谷歌大腦的一名重要工程師,後來領導了多項進展,比如創造出可以通過推理解決未曾遇到過的問題的人工智能。

去年 11 月,當 OpenAI 發佈 ChatGPT 時,公眾的反應在整個谷歌引起了震動。這家 400 人的初創公司竟然擊敗了谷歌,推出了一個可以令人信服地回答各種主題問題的聊天機器人,這讓谷歌的競爭力受到了質疑。

不過,谷歌的一些領導似乎並沒有被這個互聯網新寵兒嚇到。一位知情人士説,在 ChatGPT 推出幾周後的一次員工會議上,Dean 在回答有關聊天機器人的問題時説,谷歌不會對其他初創公司的做法做出反應。

但到了二月份,微軟宣佈將在其必應搜索引擎中應用 ChatGPT 是。一些投資者認為,聊天機器人可能會削弱谷歌在搜索領域的主導地位,這一觀點令谷歌的高管們感到危險。

思想的融合

谷歌需要做一些事情,而且要快。

於是,谷歌在短短几個月內拼湊出了 Bard 聊天機器人,並於今年 3 月正式發佈。在谷歌內部,這項工作引起了軒然大波,因為谷歌的一位著名研究員 Jacob Devlin 向皮查伊和其他高管提出了對谷歌使用 ChatGPT 的數據來訓練人工智能模型的擔憂,隨後他辭職了。他立即加入了 OpenAI,但僅僅幾個月後,他又回到了谷歌,原因不得而知。

谷歌的另一個回應是最終結束了 DeepMind 和 Google Brain 之間的內鬥。谷歌從這兩個團隊中選拔研究人員,建立了一個新的模型:Gemini 模型由 Dean 和 DeepMind 高級研究員 Oriol Vinyals 領導,後者曾與 Dean 在大腦共事。

今年 4 月,谷歌宣佈合併 Google Brain 和 DeepMind。Hassabis 接管了新實體 -- 谷歌 DeepMind,而 Dean 則退居二線,成為谷歌的首席科學家。這一舉動讓許多谷歌工程師感到震驚,他們認為,鑑於 Dean 的成就和在公司工作已久,他本應成為該部門的領導者。

領導者們試圖把合併説成是合併後部門的勝利,Google Brain 負責研究的副總裁 Zoubin Ghahramani 訪問了 DeepMind 的倫敦辦公室,在宣佈變革的那一週召開的全體會議上向員工解釋了重組的原因。Google Brain 為自己的員工單獨召開了一次會議。Hassabis 告訴員工們,谷歌 DeepMind 將彙集世界上最好的兩個人工智能研究團隊。

但谷歌的人工智能員工很快就意識到,工作重點也在發生變化。谷歌 DeepMind 的領導層縮減了對打造有競爭力的人工智能產品並不重要的研究項目。這些人説,失去資源的項目包括一個名為 Gato 的多模態模型以及一個名為 GenRL 的研究團隊,該團隊建立的人工智能系統能夠在虛擬環境中導航,就像雅達利遊戲中的虛擬環境一樣。

高管們説,這些變化還有一個額外的好處,減少工作重疊,削減優先級較低的項目,意味着員工們不必再為獲得用於研究的芯片而爭得頭破血流。

在山景城,分佈在公司園區多棟大樓的人工智能員工搬到了位於園區中心的一間辦公室,目的是加強研究人員之間的合作。

隨着 OpenAI 爆炸性崛起的衝擊逐漸消退,谷歌終於迎來了反擊的機會。

“秘密武器”

儘管如此,谷歌仍然面臨着一個巨大的挑戰:建立一個表現優於 OpenAI 最先進模型 GPT-4 的模型。

從一開始,這就意味着研究人員必須在最後期限前完成模型開發。為了在緊迫的時間內完成任務,員工們不分晝夜地工作,這種自上而下的工作方式與谷歌以往對研究實驗室放手不管的做法大相徑庭。一位與這項工作關係密切的人士説,一些員工每週工作 80 小時已成為常態。

即使在公司的人工智能之外,谷歌員工也被要求迅速掌握這項技術。據兩位知情人士透露,在這一年裏,谷歌雲要求員工通過人工智能方面的測試,併為銷售等非技術崗位的員工提供額外的材料,從而推動員工提高人工智能知識水平。

谷歌的目標是通過賦予 Gemini 理解各種不同媒體(包括文本、圖像、視頻和音頻)的能力,從而較 OpenAI 更有優勢,例如,人工智能可以用通俗易懂的英語解釋和説明覆雜圖表的內容。皮查伊後來説,Gemini 將從頭開始 根據這些類型的數據進行訓練。皮查伊很清楚,今年 3 月,OpenAI 曾宣佈為 GPT-4 提供類似的圖像識別功能,但最初並沒有廣泛提供這些功能。這讓谷歌有機會在 OpenAI 發佈之前,通過 Gemini 發佈一套廣泛的多模態模式。

谷歌還有一個秘密武器:YouTube。兩位熟知內情的人士説,谷歌研究人員在很大程度上依賴於谷歌擁有的流媒體服務,這些數據包括圖像、視頻和音頻字幕文本,對於訓練人工智能模型非常寶貴。

這讓谷歌獲得了比 OpenAI 和 AI 圖像初創公司 Midjourney 等競爭對手豐富得多的信息庫。這些人説,這也意味着谷歌必須滿足法律部門的要求,比如確保如果 YouTube 用户刪除了視頻,谷歌也會從其模型使用的數據集中刪除該內容。

谷歌的另一個優勢是計算能力,與依賴微軟服務器的 OpenAI 不同,谷歌擁有自己的數據中心。為了更高效地運行軟件,谷歌甚至打造了自己的專用人工智能芯片——張量處理單元(TPU)。谷歌為 Gemini 計劃積累了數量驚人的芯片--7.7 萬個代號為 Pufferfish 的第四代張量處理單元。第三季度,谷歌未分配的企業成本(包括在 DeepMind 上的支出)猛增近 40%,達到 16 億美元。

當倫敦的員工結束一天的工作,而山景城的員工開始一天的工作時,Gemini 的領導者通過每天與監督項目部分工作的員工舉行會議,隨時瞭解研究人員的進展情況。一位人士説,主持會議的有 Dean、Vinyals 和研究副總裁 Koray Kavukcuoglu。

高級管理人員也在戰壕裏工作,Dean 率先改進軟件,幫助公司的算法處理海量數據。聯合創始人 Sergey Brin 曾因辦公室戀情醜聞而與谷歌保持距離,但他在山景城與 Gemini 研究人員並肩工作,定期在公司食堂與他們共進午餐。

一路上也有一些尷尬的時刻,在今年 2 月為 Bard 公司做的一次演示中,聊天機器人在詹姆斯 - 韋伯太空望遠鏡的問題上犯了一個事實錯誤,這讓正努力追趕 OpenAI 的谷歌十分尷尬。兩天後,當這個錯誤廣為人知時,谷歌股價下跌了 9%。

今年 5 月,谷歌在年度開發者大會上的一次演講中首次披露了 Gemini 的存在,華爾街對此印象深刻:公司股價當天躍升了 4% 以上。

蓄力趕超

在接下來的幾個月裏,谷歌逐漸接近發佈 Gemini,9 月份谷歌讓一些開發人員使用了較小版本的 Gemini 進行測試。

但就在同一個月,OpenAI 推出了 GPT-4 with Vision,在多模態功能上擊敗了谷歌,這也為其技術帶來了更多的關注,同時也帶來了新的業務。一位與該團隊關係密切的人士説,消費者對 Bard 的使用讓團隊內部的一些高管感到失望。就在微軟宣佈其 Azure 雲計算部門收入增長 29%,令人印象深刻的同一天,谷歌在 10 月份披露其雲計算部門第三季度收入增長乏力,僅為 22%。這隻會增加 Gemini 團隊的壓力,迫使他們拿出大手筆。

然後,大約在 11 月,在對新產品進行行政審查時,本應與 GPT-4 競爭的最先進的 Gemini 模型在英語以外的語言中難以正常工作。

讓谷歌稍感安心的是,OpenAI 也在處理自己的問題。2023 年中期 OpenAI 廢棄了一個名為 Arrakis 的重要新模型,因為它在訓練中表現不佳。11 月底,OpenAI 董事會解僱了首席執行官 Sam Altman,OpenAI 幾近崩潰。Altman 在這一事件後重返 OpenAI,似乎暫時穩住了這艘船。

最後,在 12 月初,谷歌拉開了 Gemini 的帷幕。它公佈的測試結果顯示,性能最強的版本 Gemini Ultra 在多項行業標準基準測試中的表現優於 GPT-4,儘管許多研究人員對這些説法提出了質疑。谷歌公司自己也承認,該視頻誇大了 Gemini 的功能。該視頻的發佈讓公司一些事先沒有看過視頻的普通員工感到沮喪,但一連串的聲明傳遞了一個強烈的信息:谷歌已經做好了競爭的準備。

一位高管甚至發起了攻勢,抨擊微軟依賴 OpenAI 開發其尖端技術。谷歌和 Alphabet 全球事務總裁 Kent Walker 在新聞媒體 Semafor 舉辦的一次活動上説,公司不相信 “外包” 人工智能開發。

現在,谷歌面臨的考驗是將 Gemini 到各個產品應用中,就像微軟對 OpenAI 技術所做的那樣。但谷歌有一個對手不具備的優勢:Pixel 硬件設備組合,包括手機、手錶和耳塞,都能從人工智能中受益。其中一個版本的 Gemini 就是專門為在 Pixel 手機上運行而設計的,Pixel 手機使用的是谷歌定製的人工智能芯片。

在科技公司競相將自己的硬件與新的人工智能功能整合在一起的時候,Pixel 設備專用的人工智能助手的推出可能會促進谷歌硬件業務的發展。據一位知情人士透露,Pixie 將使用客户手機上的信息,包括來自谷歌地圖和 Gmail 等產品的數據,進化成更加個性化的谷歌助手。這位知情人士稱,該功能最快將於明年在 Pixel 9 和 9 Pro 上推出。

最終,谷歌希望把這項功能帶到普通手機和手錶等設備上,該公司將需要越來越先進的機型來支持其所有的產品理念。不過,谷歌似乎正在抓緊時間,確保自己不會再次陷入困境。據一位熟知內情的人士透露,谷歌已經在訓練下一代大模型 Gemini 2。