
AI 的 “安卓時刻”:開源大模型正在追上谷歌和 ChatGPT

一位計算機科學教授表示,免費的 AI 模型現在在性能上 “相當接近” 谷歌和 ChatGPT 開發商 OpenAI 的專有模型,大多數軟件開發人員最終將選擇使用免費的模型。
今年 2 月,Meta 發佈開源大語言模型 LLaMA,開啓 AI“安卓時刻”。
幾周之內,學術界的一些學者就將這些模型轉化為開源軟件,為 ChatGPT 和其他專有人工智能軟件的免費替代品提供動力。
據 The Information 週一報道,加州大學伯克利分校計算機科學教授 Ion Stoica 表示,免費的 AI 模型現在在性能上 “相當接近” 谷歌和 ChatGPT 開發商 OpenAI 的專有模型,大多數軟件開發人員最終將選擇使用免費的模型。據悉,Stoica 利用 Meta 的技術幫助開發了一個關鍵的 AI 開源模型。
這讓人想起不久前谷歌的一份泄密文件,谷歌研究員在這份泄密文件中坦言,谷歌沒有護城河,OpenAI 也是如此,與開源 AI 競爭將難以佔據優勢。
文件中提到:
“雖然我們的模型在質量上仍有一點優勢,但差距正在以令人驚訝的速度迅速縮小。開源模型訓練速度更快,可定製性更強,更私密,而且比同類產品能力更出色。他們正在用 100 美元和 130 億的參數做一些谷歌 1000 萬美元和 540 億的參數難以企及的事情,而且在短短几周內就能做到,而不是幾個月。”
這也就是説,如果以上都為真,開源人工智能可能會顛覆谷歌、OpenAI、微軟和其他出售專有模型使用權的公司的商業模式。
分析稱,開源人工智能可以讓任何人以低廉的成本獲得強大的人工智能工具,Meta 也可從中獲得回報。
專注於專有模型可能會落後
Stoica 是使用 Meta 的研究開發 Vicuna 的學者之一,Vicuna 是一種開源語言理解模型,於今年 3 月發佈。Vicuna 的質量和開源 AI 的快速發展促使谷歌高級工程師 Luke Sernau 在泄密文件中警告同事,他們的公司在追趕 OpenAI 的過程中專注於專有模型可能會落後。
他説,對於用户而言,如果有一個沒有使用限制、免費、高質量的替代品,誰還會為谷歌的產品付費呢?他還説,開源 AI 的開發正在 “掠奪我們”,並補充説 “谷歌應該讓自己成為開源社區的領導者”,並 “放棄對我們模型的一些控制權”。
這份泄密文件引起了整個行業的共鳴,包括一些谷歌員工,儘管該文件的論點可能誇大了開源人工智能的能力,低估了它的成本和其他風險,但大多數 AI 從業者都同意泄密文件的結論之一,即 Meta 將從發佈其模型中獲益。Meta 在內部使用 AI 模型進行內容推薦和廣告定位,隨着開發人員改進 Meta 發佈的模型,Meta 將能夠將這些改進整合到其內部 AI 中。
谷歌並沒有對 AI 軟件採取完全專有的方法。早在 ChatGPT 出現之前的 2020 年,它就發佈了一個開源語言模型 T5,使開發人員能夠構建可以完成翻譯和摘要等任務的軟件。谷歌隨後還發布了一個更高級的版本,Flan-T5。但據 Stoica 和其他從業人員説,Meta 發佈的軟件使谷歌的模型得到了重大改進,這使得工程師們更有可能選擇基於 Meta 軟件的模型。
報道:OpenAI 的開源語言模型也要來
據一位知情人士透露,不止是 Meta,谷歌的主要 AI 競爭對手 OpenAI 也正準備向公眾發佈一種新的開源語言模型,該計劃此前從未被報道過。
目前尚不清楚 OpenAI 即將推出的開源軟件,是否會搶走使用 Meta 模型開發的軟件的風頭。但分析稱,它不太可能發佈一款能與它正在銷售的專有模型 GPT 競爭的模型。OpenAI 270 億美元的私人估值取決於未來,儘管 GPT 的前兩個版本是開源的,但 GPT4 不是開源的。
像 Vicuna 這樣的開源模型訓練成本低至幾百美元,讓用户可以選擇避免向軟件提供商支付昂貴的費用。結果是,最近幾周,開源替代品激增。
除了基於 Meta 軟件的 Vicuna 等模型外,工程師還可以從德國非營利組織 LAION 以及 Databricks 和 Stability AI 等初創公司中選擇其他模型。Stoica 創建了一個網站,試圖評估那些開源模型與專有模型 (如 OpenAI 的 GPT-4) 的質量。
Stoica 説,與開源軟件相比,谷歌仍然有兩個優勢。1、如果谷歌利用其大量的用户數據,它的模型可以更好地用於某些特殊目的,例如內容推薦。2、谷歌在管理大型計算機基礎設施方面的專業知識意味着它將能夠以更低的成本運行 AI 軟件模型,包括用於其雲客户。
與此同時,OpenAI 在從數百萬人與 ChatGPT 交互的方式中收集數據方面取得了領先,這無疑有助於它改進 AI 軟件,而且 OpenAI 與微軟達成了一項私下協議,可以使用微軟的計算基礎設施。
但開源 AI 模型將允許更多公司使用專有數據自行解決問題。Stoica 説,例如,一家航空公司可以使用其數百萬客户服務電話的數據來創建自動響應。彭博社在 3 月份宣佈,該媒體使用其數據來訓練一種更善於理解金融信息的機器學習模型。
