The first batch of OpenAI's powerful models has arrived, with unlimited access to ChatGPT Pro's models, including the "smartest" o1

華爾街見聞
2024.12.05 20:25
portai
I'm PortAI, I can summarize articles.

ChatGPT Pro 套餐每月訂閲收費 200 美元,包括高級語音模式 Advanced Voice 和 GPT-4o、o1 等模型,以及獨有的 o1 版本 o1 pro mode。o1 pro mode 在數學、科學和編碼方面的基準測試得分均高於 o1 和 o1 preview,且在可靠性要求更嚴格的測試下,優勢更大。此外,ChatGPT Plus 套餐中納入了 o1 正式版,每月收費 20 美元,正式版支持多模態輸入,錯誤率比 o1 preview 減少 34%。

本文作者:李丹

來源:硬 AI

OpenAI CEO Sam Altman預告的 “王炸”首批出爐:OpenAI 推出了一款高端的 GPT 訂閲套餐 ChatGPT Pro。它的收費在 OpenAI 目前的各產品中最高,提供 OpenAI 旗下所有模型的無限使用權,包括 OpenAI 最強推理模型 o1 及 o1 系列的一個升級版本。

美東時間 12 月 5 日週四,OpenAI 確認了稍早一些網傳的消息,正式推出名為 ChatGPT Pro 的套餐,每月訂閲收費 200 美元。OpenAI 稱,該套餐的訂閲用户可以大規模訪問 OpenAI 旗下最佳的模型和工具,包括無限制訪問 OpenAI 最智能的模型 OpenAI o1 以及同系列較小模型 o1-mini、GPT-4o、類人的 ChatGPT 高級語音模式 Advanced Voice。

此外,ChatGPT Pro 的套餐中還包括名為 o1 pro mode 的新 o1 版本,也是 ChatGPT Pro 獨有的 o1 版本。OpenAI 稱,這個新版本使用更多的計算,能更深入地思考,併為最困難的問題提供更好的答案。希望未來為 ChatGPT Pro 添加更強大的計算密集型生產力功能。

Altman 在社交媒體發帖介紹,OpenAI 本週四有兩個新動作,一是在 ChatGPT Plus 套餐中納入了 o1,每月收費 20 美元,二是推出每月收費 200 美元的 ChatGPT Pro,它可以讓訂閲者無限使用模型、甚至是更智能的 o1。

Altman 之前在社交媒體發帖預告,從本週四開始,OpenAI 將進行為期 12 天的 OpenAI 活動,每天都會有一個直播,包括最新技術或產品演示。有網友當時預計,OpenAI 會推出所謂滿血 o1,即正式版 o1。本次 Altman 提到的 ChatGPT Plus 新納入 o1 就是這個正式版本。

正式版 o1 支持多模態輸入,具備視覺推理能力。相比 o1 view 版本,正式 o1 的平均響應速度快了 60%,OpenAI 還發現正式版 o1 在推理時犯重大錯誤的頻率比 o1 preview 減少 34%。

o1 pro mode 在數學、科學和編碼方面強於 o1 且更可靠

OpenAI 認為,ChatGPT Pro 為研究人員、工程師和其他每天使用研究級智能的個人提供了一種提高他們生產力的新方式,該方式讓他們能處於人工智能(AI)進步的前沿。

OpenAI 特別介紹了 o1 pro mode,稱 ChatGPT Pro 提供了 OpenAI“最智能模型的一個版本”,“該模型可以思考更長時間,從而獲得最可靠的回應。” 在外部專家測試人員的評估中,o1 pro mode 可以產生更可靠、更準確、更全面的回應,尤其是在數據科學、編程和案例法分析等領域。

下圖顯示,在數學、科學和編碼等具有挑戰性的機器學習(ML)基準測試中,o1 pro mode 的表現均勝過 o1 和 o1-preview。在數學方面,o1 pro mode 得分 86,o1 和 o1-preview 分別為 78 和 50,在編碼方面,o1 pro mode 得分 90,o1 和 o1-preview 分別為 89 和 62,在問答博士級別的科學問題方面,o1 pro mode 得分 79,後兩者分別為 76 和 74。

為了突出 o1 pro mode 的主要優勢——可靠性更高,OpenAI 還提高了評估門檻,要求只有在四次嘗試中四次全部能夠正確回答問題、而不是僅一次答對時,才能算作模型解決了問題。即使在這種高標準要求下,o1 pro mode 的表現也明顯強於 o1 和 o1-preview。

下圖可見,在以上四次答問都必須正確的標準下,o1 pro mode 相比 o1 和 o1-preview 的優勢更大。數學方面,o1 pro mode 得分 80,o1 和 o1-preview 分別為 67 和 37,在編碼方面,o1 pro mode 得分 75,o1 和 o1-preview 分別為 64 和 26,在問答博士級別的科學問題方面,o1 pro mode 得分 74,後兩者分別為 67 和 58。