GPT-5.4 is rumored to launch next week! 2 million context window + persistent state, saying goodbye to frequent forgetfulness

OpenAI 意外泄露 GPT-5.4！新版憑 200 萬 Tokens 的上下文窗口與 “狀態化 AI” 實現跨會話持久記憶，並支持全分辨率視覺直讀。GPT 將從聊天工具向 “全自動代理” 進化，徹底重塑工作流並引爆底層硬件內存之戰。

近日，OpenAI 的一名工程師在 Codex 的公開 GitHub 倉庫中提交了一次代碼拉取請求，無意間將「gpt-5.4」這個尚未公佈的型號寫進了版本判斷條件中。

幾乎在同一時間，帶有「alpha-gpt-5.4」標識的公共模型端點以及下拉菜單截圖在社交平台 X 上瘋狂流傳。

隨後發生的事情極為戲劇化，這些信息彷彿觸動了某種內部警報，原帖被火速刪除，涉事代碼也被強制推送覆蓋，悄悄改成了「gpt-5.3-codex」。

這種欲蓋彌彰的撤回操作，恰恰打消了外界對「佔位符誤用」的懷疑，讓看客們對新版本提前泄露的猜測可信度更高了。

種種跡象表明，OpenAI 正準備跳過 5.3 版本，醖釀一場足以重置行業格局的突襲。

坊間傳聞，這次代際跨越最快將在下週落地。

它試圖終結近期大模型領域擠牙膏式的常規更新，直接向對手甩出一張王牌。

結合目前浮出水面的多方情報，這次大版本的核心殺手鐧已經呼之欲出。

它拋棄了在常規推理基準測試裏與同行近身肉搏的路線，將主戰場轉移到了內存與上下文架構上。

高達 200 萬 Tokens 的上下文窗口配上真正的狀態化 AI（Stateful AI），讓模型從此擺脱了「金魚般的記憶」。

它能夠在不同的會話之間，完整保留你的工作流、開發環境乃至工具調用狀態。

打工人終於不用在每次新建對話時，像復讀機一樣重新交代冗長的項目背景。

模型會自帶這種持久的認知連續性，真正融入用户的日常開發節奏中。

視覺能力的暗中大躍進同樣令開發者振奮。

泄露信息中明確提到了一個專門針對「gpt-5.4 及更高版本」的功能開關，該功能允許模型繞過傳統的圖像壓縮機制，直接讀取全分辨率的原始字節。

這意味着，前端工程師和設計師可以直接丟給它極其精細的 UI 設計圖或複雜的工程原理圖，徹底告別過去 AI 對着模糊壓縮包一本正經胡説八道的體驗，實現像素級的視覺分析。

當 Gemini 3.1 Pro 和 Claude 4.6 還在各項跑分榜單上爭奪小數點後幾位的優勢時，GPT-5.4 的野心在於完成從「聊天機器人」到「全自動代理員工」的身份轉換。

它能在後台高度可靠地執行多步複雜任務，把那些號稱最先進的競品襯托得像個帶有對話框的高級計算器。

當然，這種級別的上下文和狀態保持，也直接點燃了硬件層面的「內存之戰」。

海量 KV 緩存的爆炸式增長，讓高帶寬內存和 SRAM 的調配面臨極限挑戰，光學互連技術的引入也從理論構想變為了現實需求。

OpenAI 顯然已經在底層算力架構上做好了迎接這場風暴的準備。

本文來源：新智元