當 OpenAI 在 12 月推出其 o3“推理” AI 模型時,該公司與 ARC-AGI 的創建者合作,ARC-AGI 是一個旨在測試高能力 AI 的基準,以展示 o3 的能力。幾個月後,結果被修訂,現在看起來比最初的印象稍微遜色。 上週,維護和管理 ARC-AGI 的 Arc Prize Foundation 更新了 o3 的近似計算成本。該組織最初估計它測試的 o3 最佳配置 o3 high 解決單個 ARC-AGI 問題的成本約為 3000 美元。現在,Arc Prize Foundation 認為成本要高得多——可能每個任務約為 30000 美元。 這一修訂值得注意,因為它説明了當今最複雜的 AI 模型在某些任務上可能會變得多麼昂貴,至少在早期階段。OpenAI 尚未為 o3 定價——甚至還沒有發佈它。但 Arc Prize Foundation 認為 OpenAI 的 o1-pro 模型定價是一個合理的參考。 作為背景,o1-pro 是 OpenAI 迄今為止最昂貴的模型。 “我們認為 o1-pro 是對真實 o3 成本的更接近比較 […],因為使用的測試時間計算量,” Arc Prize Foundation 的聯合創始人 Mike Knoop 告訴 TechCrunch。“但這仍然是一個參考,我們在我們的排行榜上將 o3 標記為預覽,以反映在官方定價公佈之前的不確定性。” 考慮到該模型據説使用的計算資源量,o3 high 的高價格並不是不可能的。根據 Arc Prize Foundation 的説法,o3 high 在處理 ARC-AGI 時使用的計算量是 o3 low(o3 的最低計算配置)的 172 倍。 此外,關於 OpenAI 考慮為企業客户推出高價計劃的傳聞已經流傳了一段時間。3 月初,《信息報》報道該公司可能計劃對專門的 AI“代理” 收取每月高達 20000 美元的費用,例如軟件開發代理。 一些人可能會爭辯説,即使是 OpenAI 最昂貴的模型,其成本也遠低於典型人類承包商或員工的費用。但正如 AI 研究員 Toby Ord 在 X 上的一篇帖子中指出的,這些模型可能並不那麼高效。例如,o3 high 在 ARC-AGI 中每個任務需要 1024 次嘗試才能達到最佳得分。