Open source, diversification, commercialization, Google is challenging large models

谷歌在 2024 年 I/O Connect China 開發者大會上發佈了多種 Gemini 模型，包括 Gemini Nano、Gemini 1.5 Flash 和 Gemini 1.5 Pro。Gemini 1.5 Pro 和 1.5 Flash 已上線上下文緩存功能，以降低算力消耗。此外，谷歌還發布了姊妹大模型 Gemma，新增了 90 億和 270 億參數兩種規格。Gemini 相關模型已集成到多個開發工具中，可幫助開發者編寫、調試、測試代碼等。此外，谷歌還推出了 Flutter 3.24 和 Dart 3.5，其中最大看點是 “Flutter GPU” 新 API 的早期預覽版，可提高圖像渲染能力。

編輯 | 楊博丞

題圖 | IC Photo

在日前谷歌舉辦的 2024 年 I/O Connect China 谷歌開發者大會上，AI 大模型多元化成為市場關注的焦點。

圍繞 APP 軟件開發，谷歌推出三種不同規格的 Gemini 模型。谷歌方面稱，Gemini Nano 是最高效的模型，適合處理設備端任務。

據悉，Gemini 1.5 Flash 是谷歌迄今為止最快、最經濟的模型，適合處理高容量任務。面對所有開發者開放的 Gemini 1.5 Pro，支持 200 萬 token 上下文窗口。為減少算力消耗，Gemini 1.5 Pro 和 1.5 Flash 均已上線上下文緩存功能。

考慮到開發者可能需要更大的靈活性和掌控力，谷歌推出 Gemini 姊妹大模型 Gemma。新發布的 Gemma2 相較於 Gemma，新增 90 億和 270 億參數兩種規格。其中，270 億參數版本經過優化，同時支持 Google Cloud 上的單個英偉達 GPU 以及 Vertex AI 單個 TPU 運行。

目前 Gemini 相關大模型已集成到 Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ 和 Firebase 等開發工具中，可幫助開發者編寫、調試、測試代碼、生成文檔、理解代碼庫等。

以 Flutter 為例，小米 SU7 配套應用就是基於 Flutter 所打造。在原有 Flutter 基礎上，谷歌推出 Flutter 3.24 和 Dart 3.5。新版最大看點是 “Flutter GPU” 新 API 的早期預覽版。如通過內置 Flutter SDK，開發者可使用 Dart 代碼訪問 GPU，進而提高圖像渲染能力。

為方便開發者使用，谷歌推出多個 Package。如 Flutter_Scene 可將 3D 項目直接導入，進而提高遊戲體驗。

此外，谷歌也推出 Android Studio ON IDX 早期預覽版，和原有 Android Studi 不同的是其支持在瀏覽器中完全運行。為保證藉助 AI 構建應用的可靠性、合規性和安全性。谷歌推出包括如 Firebase AI Monitoring 信息中心、Checks AI Safety 等開發組件。

在 AI 大模型開源席捲全球下，谷歌推出開源大模型項目 Project Oscar。但初始階段，Project Oscar 僅支持 93000 條代碼提交以及 2000 名開發者 Go 編程語言項目。

圍繞 Web 網站開發，隨着 Web GPU、WASM 和 Gemini 內置到 Chrome 中，谷歌全新推出的 Speculation Rules API 可做到搜索即時導航，擺脱冗長頁面加載。面向單頁應用推出的 View Transitions API，可提高頁面過渡體驗。二者結合，進而保證頁面過渡的無縫銜接。

為保證 Web 開發者開發效率，谷歌順勢推出試和優化應用 Chrome DevTools，其在開發者網站出現問題時會發出警告和錯誤提示。該應用已內置到 Gemini 中。

圍繞下一代安卓原生應用開發，谷歌推出多款新產品。設備端 AI 模型 Gemini Nano 和系統服務 AI Core；用於業務邏輯共享代碼，適用於移動端、Web、服務器和桌面平台的 Kotlin Multi Platform；併為 DataStore、Room 和 ViewModel 等多個 Jetpack 庫添加 Kotlin Multi platform 支持。

測試平台 Android Device Streaming，則聯合小米、OPPO、一加、三星等手機廠商，方便開發者進行終端測試，現處於 Beta 階段。Gemini in Android Studio 納入 Android Studio 穩定版，新增代碼生成和代碼轉換功能，以及 AI 隱私設置控制數據分享功能。

圍繞雲業務，谷歌提出的雲端新旅程具有五大特點：一是雲上開發新範式，新推出的 Vertex AI 功能可實現上下文緩存和接地功能。二是自成體系的靈活擴展，新推出 150 多種模型，包括 Gemini 系列、Gemma 開源模型、Anthropic Claude 模型、Meta Llama 模型和 Hugging Face 模型庫。

三是打破壁壘的跨雲之旅，新推出的優化 PostgreSQL 數據庫和 BigQuery Omni 功能，支持跨雲互聯和聯合查詢以及多 “雲” 協同。四是輕鬆實現強大功能，新推出的自動化與智能默認設置，搭建全套雲基礎設施只需 45 分鐘，包括網絡、身份驗證和日誌記錄等。

五是 AI 智能助力，新推出的 Gemini Code AssistIDE 插件，提供代碼生成、補全、解釋和測試生成功能。Gemini in Databases 則提供 SQL 生成和數據庫操作智能化。

圍繞開發者發佈多款大模型，無疑彰顯谷歌想要加速推進大模型商業化的決心。但目前谷歌的 AI 能力，尤其是輸出和檢索能力可能仍需提高。

今年 6 月份海外用户在詢問谷歌 “製作披薩使用多少膠水” 問題時，谷歌 AI 搜索給出的答案為：據 Business insider2024 年 5 月的相關顯示文章，谷歌 Al 搜索結果建議在披薩醬中加入 1/8 杯，即 2 湯匙，白色無毒的膠水，以防止奶酪滑落。

文章作者 KatieNotopoulos 表示，膠水沒有明顯改變醬汁的稠度，而披薩呈現出誘人的橙色。海外媒體 The Verge 驗證後發現，該截圖並非偽造。因披薩中不能加入任何膠水，該答案也引發海外用户對谷歌 AI 檢索能力的質疑。

圖源：The Verge

我們在對 Gemini 實測過程中發現，一方面 Gemini 文生圖能力已被關閉，且 Gemini 暫時也不支持文生視頻。另一方面，Gemini 的邏輯推理、數學計算能力仍需提高。

圖源：Gemini 官網

我們將 2024 年高考數學真題給到 Gemini 且特意強調是多選題，三道題目正確答案分別為（BD）（ACD）（ABC），但 Gemini 給出的答案分別是（AC）（AD）（AB），雖説第 10 題和第 11 題 Gemini 的答案包括正確選項，但第 9 題卻全部是錯誤選項。

圖源：2024 年高考數學真題

圖源：Gemini 官網

此外，隨着谷歌大模型日益增多，正面臨數據中心電力消耗產生的二氧化碳排放迅速增加的棘手問題。

谷歌相關環境報告指出，2023 年僅谷歌數據中心電力消耗就增長 17%，由電力消耗所產生的二氧化碳污染較 2022 年同期增長 13% 至 1430 萬噸，大致相當於 38 家燃氣發電廠每年可能排放的二氧化碳量。

不僅僅是谷歌，Microsoft2023 財年的温室氣體排放量比 2020 年高出約 30%。對於未來如何降低碳排放，谷歌相關報告指出，隨着我們進一步將人工智能集成到我們的產品中，由於人工智能計算強度的增加導致的能源需求增加，以及與我們的技術基礎設施投資預期增加相關的排放，減少排放可能具有挑戰性。

按照當前 AI 大模型發展速度，未來對電力需求或將成倍增長。作為全球擁有最多數據中心的美國，引發當地民眾對人工智能壓倒電網的電力需求急劇上升的擔憂，並可能使煤炭和天然氣工廠的存在時間比其他方式更長。

商業化、輸出質量穩定化、減碳化等各種問題的存在，即使對於谷歌這樣的全球大廠短期內也難言輕鬆。