GPT-5 首次曝光後，Altman：現在最重要的事就是 GPT-5

據 Altman 介紹，GPT-5 將是一個多模態模型，支持語音、圖像、代碼和視頻，並在個性化和定製化功能方面實現重大更新，具備更強的推理能力和更高的準確性。當前大模型的通病——幻覺問題也將在 GPT-5 中得到解決。

OpenAI 首席執行官 Sam Altman 週三在達沃斯論壇接受媒體採訪時表示，他現在的首要任務就是推出下一代大模型，這款模型可能被稱為 GPT-5，與現有模型相比，GPT-5 “能做更多、更多的事情”。

OpenAI 從去年開始訓練 GPT-5，幾天前，Altman 在與微軟創始人比爾·蓋茨的對話中，首次曝光了有關 GPT-5 的詳細信息，對其未來的應用前景進行了分享。

據 Altman 介紹， GPT-5 將是一個多模態模型，支持語音、圖像、代碼和視頻，並在個性化和定製化功能方面實現重大更新，具備更強的推理能力和更高的準確性。當前大模型的通病——幻覺問題也將在 GPT-5 中得到解決。

個性化大禮包，真正的多模態模型？

Altman 強調，GPT-4.5 或 GPT-5 預計將在個性化和定製化功能方面實現重大更新，最關鍵的增強部分將圍繞理解個人偏好的能力，比如整合用户信息、電子郵件、日曆、約會偏好，以及與外部數據源建立聯繫。

“人們對 GPT-4 的不滿和希望加強的部分，” Altman 説，“包括不同的風格，不同的假設集，我們將使所有這些成為可能，然後還能讓它使用你自己的數據。”

當前外界對 GPT-5 的瞭解知之甚少，但從當前 Altman 披露的信息，分析預計 GPT-5 將是一個真正的多模態模型，類似於谷歌最近推出的新 Gemini Ultra 模型。

據 Altman 介紹，GPT-5 不僅支持文本輸入，還支持語音、圖像、代碼和視頻。

“輸入語音，輸出語音，圖像、視頻亦是如此，” Altman 表示，“顯然，人們真的希望如此。我們已經支持了圖像和音頻，它的反饋比我們預期的要強烈得多。”

據 Altman 介紹，GPT-5 將具有更強的推理能力、更高的準確性。

當代大模型存在的最大問題——幻覺（胡編亂造）將在 GPT-5 中得到解決，這涉及到大模型的可靠性。

他告訴比爾·蓋茨：“如果你問 GPT-4 大部分問題 10000 次，這 10000 次中可能有一次回答得很好，但它不一定知道是哪一次。而你卻希望每次都能得到這 10000 次中最好的回答，因此可靠性的提升將非常重要。”

Altman 告訴比爾•蓋茨，現有 AI 模型都將變成最愚蠢的模型，至少在未來的五年或十年內，這項技術將處於一個非常陡峭的成長曲線上。

他表示：“未來 AI 系統的計算能力將是 GPT-4 的 10 萬倍或 100 萬倍，AI 將影響社會，影響地緣政治力量的平衡，以及其他許多事物。”

眾所周知，OpenAI 等許多大型人工智能實驗室都將通用人工智能 (AGI) 作為最終目標，因此，早期有人認為，GPT-5 可能是某種形式的超級智能。

但根據現有的信息，GPT-5 很可能只是 GPT-4、Claude 2 或 Gemini Ultra 的改進版，它將具備更強的推理能力，不僅在許多學術評估上優於人類，理解能力也在一定程度上超越人類。

不過，GPT-5 也可能是通往 AGI 道路上的下一步。據媒體報道，在上週五的 Y-Combinator W24 活動上，Altman 告訴在場的創始人和企業家，他們應該抱着 AGI 將 “相對較快” 實現的心態。

在達沃斯論壇的媒體採訪中，Altman 並沒有透露 GPT-5 的具體發佈時間。他説：

“我希望我們能夠慢慢來，確保我們能夠推出一個讓我們感到滿意並且對 OpenAI 來書足夠負責任的產品。”

Altman 還説，GPT-5 也可能不會被叫做 GPT-5，因為這並不符合 Altman 發佈產品的風格。