OpenAI 疑似秘密測試 GPT-5.6:回應速度變慢、推理能力卻顯著提升
編輯核心觀點
- ✦社群平台 X 湧現大量測試報告,指出 OpenAI 正針對部分 ChatGPT Pro 用戶進行 GPT-5.6 模型的秘密 A/B 測試。
- ✦多位開發者回報該模型在 3D 遊戲開發與網頁設計任務上表現優異,但生成時間大幅拉長,甚至出現長達 60 分鐘的處理過程。
- ✦儘管 OpenAI 尚未正式回應,但市場預測該模型最快可能於 6 月 25 日正式發布,以應對競爭對手 Anthropic 與中國 GLM-5.2 的市場挑戰。

近期在社群平台 X 上,許多 ChatGPT 用戶發現系統出現了顯著變化。開發者與測試者透過截圖與計時數據指出,OpenAI 可能正在針對部分訂閱 GPT-5.5 Pro 的用戶,秘密進行代號為 GPT-5.6 的模型測試。
回應速度變慢,但推理與設計能力提升
根據開發者 Anshu Chimala 分享的對比影片,GPT-5.6 在處理單次提示(one-shot)的網頁登陸頁面設計時,展現出比 5.5 版本更佳的設計能力。另一位開發者 Dobroslav Radosavljevič 則表示,在 OpenAI 的編碼代理工具 Codex 中運行時,該模型的表現與 5.5 版本有著「天壤之別」。
然而,效能提升伴隨著顯著的延遲。多位用戶回報,過去在 GPT-5.5 Pro 上僅需 10 分鐘即可完成的 3D 瀏覽器遊戲開發任務,在 GPT-5.6 上耗時超過 60 分鐘。AI 測試者 Chetas Lua 指出:
GPT 5.6 Pro 在 3D 測試中持續超越 Anthropic 的 Fable 5,且能一次性完成遊戲開發,但回應時間已拉長至 20 到 40 分鐘,回到了 5.5 Pro 發布前的狀態。
並非所有測試結果都一面倒。AI 基準測試者 Chris 進行了太空船建模測試,發現 GPT-5.6 耗時 87 分鐘,遠高於 GPT-5.5 Extra High 的 34 分鐘,且在核心幾何結構的處理上,仍略遜於 Fable 5 模型。
市場競爭與發布傳聞
關於 GPT-5.6 的規格傳言四起,據稱其知識庫截止日期已推遲至 2025 年 12 月,且被稱為「Juice Value」的推理努力設定值從 768 提升至 960。雖然 OpenAI 官方未證實任何細節,但據《The Information》報導,OpenAI 首席科學家 Jakub Pachocki 曾向內部員工透露,下一代模型將比 GPT-5.5 有顯著進步。
OpenAI 此時加速推動新模型,背景因素可能與市場競爭有關。中國的開源模型 GLM-5.2 在工程專案基準測試中已超越 GPT-5.5;同時,Anthropic 的旗艦模型 Fable 5 因出口管制與漏洞問題暫時受限,市場出現了高階模型的競爭空窗期。此外,據《華爾街日報》報導,由於面臨 IPO 壓力,OpenAI 正評估調降開發者與企業用戶的 API 費用,以應對與 Anthropic 的價格競爭。
目前 Polymarket 預測市場顯示,該模型在 6 月 22 日至 28 日間發布的合約價格已飆升至 89%,顯示市場對其發布時程的高度期待。



