
GPT-5.4 is rumored to launch next week! 2 million context window + persistent state, saying goodbye to frequent forgetfulness

OpenAI 意外泄露 GPT-5.4!新版憑 200 萬 Tokens 的上下文窗口與 “狀態化 AI” 實現跨會話持久記憶,並支持全分辨率視覺直讀。GPT 將從聊天工具向 “全自動代理” 進化,徹底重塑工作流並引爆底層硬件內存之戰。
近日,OpenAI 的一名工程師在 Codex 的公開 GitHub 倉庫中提交了一次代碼拉取請求,無意間將「gpt-5.4」這個尚未公佈的型號寫進了版本判斷條件中。


幾乎在同一時間,帶有「alpha-gpt-5.4」標識的公共模型端點以及下拉菜單截圖在社交平台 X 上瘋狂流傳。

隨後發生的事情極為戲劇化,這些信息彷彿觸動了某種內部警報,原帖被火速刪除,涉事代碼也被強制推送覆蓋,悄悄改成了「gpt-5.3-codex」。

這種欲蓋彌彰的撤回操作,恰恰打消了外界對「佔位符誤用」的懷疑,讓看客們對新版本提前泄露的猜測可信度更高了。
種種跡象表明,OpenAI 正準備跳過 5.3 版本,醖釀一場足以重置行業格局的突襲。
坊間傳聞,這次代際跨越最快將在下週落地。

它試圖終結近期大模型領域擠牙膏式的常規更新,直接向對手甩出一張王牌。
結合目前浮出水面的多方情報,這次大版本的核心殺手鐧已經呼之欲出。
它拋棄了在常規推理基準測試裏與同行近身肉搏的路線,將主戰場轉移到了內存與上下文架構上。
高達 200 萬 Tokens 的上下文窗口配上真正的狀態化 AI(Stateful AI),讓模型從此擺脱了「金魚般的記憶」。


它能夠在不同的會話之間,完整保留你的工作流、開發環境乃至工具調用狀態。
打工人終於不用在每次新建對話時,像復讀機一樣重新交代冗長的項目背景。
模型會自帶這種持久的認知連續性,真正融入用户的日常開發節奏中。
視覺能力的暗中大躍進同樣令開發者振奮。
泄露信息中明確提到了一個專門針對「gpt-5.4 及更高版本」的功能開關,該功能允許模型繞過傳統的圖像壓縮機制,直接讀取全分辨率的原始字節。

這意味着,前端工程師和設計師可以直接丟給它極其精細的 UI 設計圖或複雜的工程原理圖,徹底告別過去 AI 對着模糊壓縮包一本正經胡説八道的體驗,實現像素級的視覺分析。
當 Gemini 3.1 Pro 和 Claude 4.6 還在各項跑分榜單上爭奪小數點後幾位的優勢時,GPT-5.4 的野心在於完成從「聊天機器人」到「全自動代理員工」的身份轉換。

它能在後台高度可靠地執行多步複雜任務,把那些號稱最先進的競品襯托得像個帶有對話框的高級計算器。
當然,這種級別的上下文和狀態保持,也直接點燃了硬件層面的「內存之戰」。
海量 KV 緩存的爆炸式增長,讓高帶寬內存和 SRAM 的調配面臨極限挑戰,光學互連技術的引入也從理論構想變為了現實需求。
OpenAI 顯然已經在底層算力架構上做好了迎接這場風暴的準備。
本文來源:新智元
