AI large-scale cost reduction? Another "open-source inference model" comparable to o1 has arrived, using Alibaba's model to generate data, with training costs surprisingly under $450!

華爾街見聞
2025.01.12 08:44
portai
I'm PortAI, I can summarize articles.

開發成本的大幅降低主要得益於合成訓練數據的應用——NovaSky 團隊利用阿里巴巴的 QwQ-32B-Preview 模型生成了初始訓練數據,隨後 “整理” 數據混合,並利用 OpenAI 的 GPT-4o-mini 將數據重構為更易用的格式,最終形成了可用的訓練集。

低成本訓練人工智能推理模型的時代到來了?

近日,加州大學伯克利分校 Sky Computing Lab 的研究團隊 NovaSky 發佈了一個名為 Sky-T1-32B-Preview 的開源人工智能推理模型,這一模型在多項關鍵基準測試中表現出與 OpenAI 早期 o1 版本相當的水平,更令人矚目的是,其開發成本僅為 450 美元!

相較於不久前動輒數百萬美元的模型開發費用,Sky-T1-32B-Preview 可謂是一個巨大的進步。NovaSky 團隊在博客文章中表示:

“Sky-T1-32B-Preview 的訓練成本不到 450 美元,這證明了以低成本、高效率複製高級推理能力是可行的。”

那麼,為什麼 NovaSky 團隊能大幅降低訓練成本?

根據 NovaSky 團隊的報告,開發成本的大幅降低主要得益於合成訓練數據的應用——NovaSky 團隊利用阿里巴巴的 QwQ-32B-Preview 模型,生成了 Sky-T1-32B-Preview 的初始訓練數據,隨後 “整理” 數據混合,並利用 OpenAI 的 GPT-4o-mini 將數據重構為更易用的格式,最終形成了可用的訓練集。使用 8 個 Nvidia H100 GPU 機架訓練 320 億參數的 Sky-T1-32B-Preview 模型,大約需要 19 個小時。

報告還提到,Sky-T1-32B-Preview 在 MATH500(一套競賽級數學挑戰題)和 LiveCodeBench(一個編程評估集)的部分難題上,表現優於 o1 的早期預覽版;在 GPQA-Diamond(包含 PhD 級別的物理、生物和化學問題)測試中,Sky-T1-32B-Preview1 的表現略遜於 o1 預覽版。

不過需要注意的是,OpenAI 正式發佈的 o1 版本性能更強,且預計將在未來幾周內推出更先進的 o3 模型。