更快、更便宜！Sam Altman 最新訪談透露 OpenAI 下一步計劃，目前 GPU 短缺是最大瓶頸

Sam Altman 指出，目前 OpenAI 的客户最不滿的便是 API 的可靠性和速度，在讓 GPT-4 更便宜且更快的過程中，遇到的最大瓶頸便是 GPU 短缺。

GPU、GPU 還是 GPU，AI 掀起的 “算力革命” 不僅讓幾乎壟斷 GPU 市場的英偉達成了聚光燈下的焦點，也讓 OpenAI CEO 在一次又一次的訪談中大談 GPU 短缺問題。

5 月 29 日，Humanloop，一家從事機器學習和人工智能的初創公司，其 CEO Raza Habib 邀請了包括 OpenAI CEO Sam Altman 在內的 20 位開發人員共通探討人工智能的未來，而整個討論中最重要的主題便是——GPU 短缺是最大瓶頸。

Altman 表示，目前 OpenAI 的客户最不滿的便是 API 的可靠性和速度，而這個問題主要就是 GPU 短缺造成的。

這場算力革命，讓英偉達今年以來一度暴漲 170%，躋身萬億市值公司行列，在 GPU 持續短缺的當下，圍繞着英偉達的狂歡還將繼續嗎？

OpenAI 嚴重依賴 GPU

Altman 表示，他們的下一步計劃就是不斷更新 GPT-4，讓其更便宜，更快，而在發展過程中遇到的最大瓶頸便是 GPU 短缺，訪談中指出：

長度為 32k 的上下文窗口還未到推廣時機，OpenAI 還未能克服技術上的障礙，主要是因為算法的高複雜性。雖然很快就會有 10 萬—100 萬新的 32K 上下文窗口 token，但提供更多的訪問 token 則需要技術和研究上突破。

微調（Fine-Tuning）API 目前也受到 GPU 可用性的限制。他們還沒有使用像 Adapters 或 LoRa 這樣的高效微調方法，所以微調運行和管理需要高精度的計算。將來會有更好的微調支持。他們甚至可能主持一個社區貢獻模型的市場。

OpenAI 提供的專用容量服務受到 GPU 的限制。當用户請求使用專用容量時，OpenAI 需要確保有足夠的 GPU 可供分配給用户。然而，由於 GPU 資源有限，供應有限。要使用這項服務，客户必須願意預付 10 萬美元的費用。

對於 OpenAI 未來的發展，Altman 表示，在 2023 年 OpenAI 的目標是儘可能降低 “智能的成本”，繼續降低 API 的成本：

更便宜、更快的 GPT-4 —— 首要任務。

更長的上下文窗口 —— 在不久的將來，高達一百萬的上下文窗口 token。

微調（Fine-Tuning）API —— 微調 API 將擴展到最新的模型，但這的確切形式將由開發者表明他們真正想要的東西來塑造。

支持會話狀態的 API —— 現在當你調用聊天 API 時，你必須反覆重複歷史對話，並反覆支付同樣的 tokens。在未來，API 將有一個記住對話歷史的版本。

在 5 月 16 日舉行的 AI 國會聽證會上，Altman 就已經表達了對算力瓶頸的擔憂：由於計算能力瓶頸，如果使用 ChatGPT 的人少一些會更好。

英偉達的狂歡還將繼續？

在這場 AI 大戰中，華爾街高呼，英偉達是唯一 “軍火商”，其超預期業績指引讓市場開啓了一場圍繞着英偉達的狂歡，股價再次節節攀升，市值一度突破萬億美元大關。

目前，包括谷歌和微軟在內，許多科技巨頭都使用英偉達芯片來為 AI 業務提供算力。谷歌計劃將生成式 AI 技術嵌入六個產品，每一個都手握超過 20 億用户。

英偉達週一在 COMPUTEX 大會上推出了新產品，覆蓋了從機器人到遊戲的多個領域。它還宣佈了一個新的超級計算機平台——DGX GH200 助力新一代大 AI 模型。谷歌、微軟和 Meta 預計是獲得訪問權的首選客户。會上，英偉達 CEO 黃仁勳表示，全球 4 萬家大公司和 1.5 萬家初創公司正在使用英偉達的技術。

英偉達最近表示，該公司正在擴大供應，以滿足不斷增長的需求。英偉達 CEO 黃仁勳週日表示，該公司已經提高了用於生成式人工智能的新款旗艦芯片 H100 的產量。