更快、更便宜!Sam Altman 最新訪談透露 OpenAI 下一步計劃,目前 GPU 短缺是最大瓶頸

華爾街見聞
2023.06.01 06:49
portai
I'm PortAI, I can summarize articles.

Sam Altman 指出,目前 OpenAI 的客户最不滿的便是 API 的可靠性和速度,在讓 GPT-4 更便宜且更快的過程中,遇到的最大瓶頸便是 GPU 短缺。

GPU、GPU 還是 GPU,AI 掀起的 “算力革命” 不僅讓幾乎壟斷 GPU 市場的英偉達成了聚光燈下的焦點,也讓 OpenAI CEO 在一次又一次的訪談中大談 GPU 短缺問題。

5 月 29 日,Humanloop,一家從事機器學習和人工智能的初創公司,其 CEO Raza Habib 邀請了包括 OpenAI CEO Sam Altman 在內的 20 位開發人員共通探討人工智能的未來,而整個討論中最重要的主題便是——GPU 短缺是最大瓶頸。

Altman 表示,目前 OpenAI 的客户最不滿的便是 API 的可靠性和速度,而這個問題主要就是 GPU 短缺造成的。

這場算力革命,讓英偉達今年以來一度暴漲 170%,躋身萬億市值公司行列,在 GPU 持續短缺的當下,圍繞着英偉達的狂歡還將繼續嗎?

OpenAI 嚴重依賴 GPU

Altman 表示,他們的下一步計劃就是不斷更新 GPT-4,讓其更便宜,更快,而在發展過程中遇到的最大瓶頸便是 GPU 短缺,訪談中指出:

長度為 32k 的上下文窗口還未到推廣時機,OpenAI 還未能克服技術上的障礙,主要是因為算法的高複雜性。雖然很快就會有 10 萬—100 萬新的 32K 上下文窗口 token,但提供更多的訪問 token 則需要技術和研究上突破。

微調(Fine-Tuning)API 目前也受到 GPU 可用性的限制。他們還沒有使用像 Adapters 或 LoRa 這樣的高效微調方法,所以微調運行和管理需要高精度的計算。將來會有更好的微調支持。他們甚至可能主持一個社區貢獻模型的市場。

OpenAI 提供的專用容量服務受到 GPU 的限制。當用户請求使用專用容量時,OpenAI 需要確保有足夠的 GPU 可供分配給用户。然而,由於 GPU 資源有限,供應有限。要使用這項服務,客户必須願意預付 10 萬美元的費用。

對於 OpenAI 未來的發展,Altman 表示,在 2023 年 OpenAI 的目標是儘可能降低 “智能的成本”,繼續降低 API 的成本:

更便宜、更快的 GPT-4 —— 首要任務。

更長的上下文窗口 —— 在不久的將來,高達一百萬的上下文窗口 token。

微調(Fine-Tuning)API —— 微調 API 將擴展到最新的模型,但這的確切形式將由開發者表明他們真正想要的東西來塑造。

支持會話狀態的 API —— 現在當你調用聊天 API 時,你必須反覆重複歷史對話,並反覆支付同樣的 tokens。在未來,API 將有一個記住對話歷史的版本。

在 5 月 16 日舉行的 AI 國會聽證會上,Altman 就已經表達了對算力瓶頸的擔憂:由於計算能力瓶頸,如果使用 ChatGPT 的人少一些會更好

英偉達的狂歡還將繼續?

在這場 AI 大戰中,華爾街高呼,英偉達是唯一 “軍火商”,其超預期業績指引讓市場開啓了一場圍繞着英偉達的狂歡,股價再次節節攀升,市值一度突破萬億美元大關。

目前,包括谷歌和微軟在內,許多科技巨頭都使用英偉達芯片來為 AI 業務提供算力。谷歌計劃將生成式 AI 技術嵌入六個產品,每一個都手握超過 20 億用户。

英偉達週一在 COMPUTEX 大會上推出了新產品,覆蓋了從機器人到遊戲的多個領域。它還宣佈了一個新的超級計算機平台——DGX GH200 助力新一代大 AI 模型。谷歌、微軟和 Meta 預計是獲得訪問權的首選客户。會上,英偉達 CEO 黃仁勳表示,全球 4 萬家大公司和 1.5 萬家初創公司正在使用英偉達的技術。

英偉達最近表示,該公司正在擴大供應,以滿足不斷增長的需求。英偉達 CEO 黃仁勳週日表示,該公司已經提高了用於生成式人工智能的新款旗艦芯片 H100 的產量。