Detailed analysis of "Apple Intelligence": Apple's self-developed, GPT-4o, or Google Gemini?

華爾街見聞
2024.06.12 12:11
portai
I'm PortAI, I can summarize articles.

ChatGPT 只是一小部分,蘋果 AI 戰略基於端側小模型,自研雲端模型以及外部大模型等三層模型架構,並注重將 AI 功能無縫整合到操作系統,融入用户使用場景中。

在落後同行們近兩年後,蘋果終於在本週 WWDC 大會發布 AI 功能。

“不拼 AI 技術,靠的是 OpenAI 大模型,AI 功能沒有新意......” 以 “重新定義 AI” 開啓新徵程的蘋果似乎並沒讓大家滿意,本次大會蘋果也幾乎並沒有提 “人工智能”,而稱之為 “蘋果智能”(Apple Intelligence)。

然而,資本市場卻買單了,蘋果週三扭轉跌勢,一夜暴漲 7%,市值攀升 2000 億美元。

那麼是什麼讓市場扭轉態度?所謂 “蘋果智能” 到底意味着什麼?蘋果 AI 戰略僅靠 OpenAI?

貫穿蘋果生態場景的 AI

與大模型公司蜂擁推出獨立的聊天機器人不同,蘋果做出的選擇是,將 AI 功能整合到用户正在使用的 APP 和產品中,融入用户日常使用場景中。

這樣一來,蘋果 AI 的功能遠比獨立聊天機器人能做的要多,可以智能照片編輯、生成筆記和短信摘要、自動轉錄語音備忘錄等等。

蘋果利用自研內部模型實現較為簡單的 AI 功能,依靠更為強大的外部模型,如 GPT 來實現更高級、複雜的 AI 功能。以全新 siri、寫作工具的演示為例:

全新 Siri:蘋果公司展示瞭如何用 Siri 幫忙填寫 PDF 表格,Siri 還能找到用户駕照的照片,提取駕照上的號碼並輸入表格。在另一個演示中,Siri 可以在短信和郵件中搜索朋友發送的食譜。

真正讓 Siri 功能得到提升的是 ChatGPT。當要求 Siri 做一些它不知道怎麼做的事情時,比如根據最近的購物清單安排出一頓晚餐菜譜,Siri 就會在徵求用户允許後,直接調用 GPT 接口,向 ChatGPT 徵詢意見。用户不必是 ChatGPT Plus 的用户,就可以享受 Siri 這種功能。

寫作工具:蘋果將為備忘錄、郵件、Pages 文稿等應用添加總結、改寫和校對的 AI 功能,集成寫作工具還可以針對短信和電子郵件提出回覆建議和不同語氣的回覆。

但至於更有創意的功能,比如寫一首關於 iPhone 的詩,將交給 ChatGPT 來完成。同樣的這個寫作工具會先徵求用户同意,然後才會去諮詢 ChatGPT。

蘋果表示,Apple Intelligence、iOS 18、iPadOS 18 和 MacOS Sequoia 將在秋季整合一系列 AI 功能,但一些更強大的 AI 功能可能要到 2025 年才會亮相。

場景背後的三層大模型架構

支撐以上場景功能背後的內部、外部模型,可以進一步細分為端側小模型(Apple On-Device),自研雲端模型(Apple Server),以及 ChatGPT 等外部大模型。

第一層架構是蘋果端側小模型,其中一個參數量為 3B,可以直接在手機等終端設備上運行。

此前文章指出,這其實是綜合考慮了運行速度、算力需求的結果,大部分蘋果端側模型根據用户個人習慣和個人數據,針對不同的任務預先進行了訓練,因此各種需求響應速度也很快。

第二層是蘋果自研的更大語言模型,該模型通過私有云計算在蘋果芯片服務器上運行。

性能方面,有分析指出該模型雖然沒有明確參數量,但其性能可以與 GPT-4 對標。在真實世界提示評估中,大模型 Apple Server 性能強於 GPT-3.5-Turbo,略遜於 GPT-4-Turbo,該模型也針對蘋果用户的日常行為進行微調訓練。

蘋果強調隱私是第一位,內部模型運行過程中這些數據不會被保存,不會被其他人獲取。

此前文章提到過,這些服務器都內置使用 Swift 語言編寫的安全工具,蘋果 AI“只發送完成任務所需的相關數據” 到這些服務器,不會給予對設備上下文信息的完全訪問權限。

第三層架構就是和 OpenAI 合作,接入 GPT 大模型。

根據蘋果演示,當需要實現更復雜 AI 功能,且在獲得用户同意後,可以調用 GPT 接口。

而且可以確定的是,OpenAI 可能不會是蘋果唯一的外部合作伙伴。蘋果負責軟件工程的高級副總裁 Craig Federighi 表示:

蘋果計劃以後讓用户選擇自己喜歡的大模型,其中包括谷歌的 Gemini 等。