OpenAI 疑似秘密測試 GPT-5.6：回應速度變慢、推理能力卻顯著提升

近期在社群平台 X 上，許多 ChatGPT 用戶發現系統出現了顯著變化。開發者與測試者透過截圖與計時數據指出，OpenAI 可能正在針對部分訂閱 GPT-5.5 Pro 的用戶，秘密進行代號為 GPT-5.6 的模型測試。

回應速度變慢，但推理與設計能力提升

根據開發者 Anshu Chimala 分享的對比影片，GPT-5.6 在處理單次提示（one-shot）的網頁登陸頁面設計時，展現出比 5.5 版本更佳的設計能力。另一位開發者 Dobroslav Radosavljevič 則表示，在 OpenAI 的編碼代理工具 Codex 中運行時，該模型的表現與 5.5 版本有著「天壤之別」。

然而，效能提升伴隨著顯著的延遲。多位用戶回報，過去在 GPT-5.5 Pro 上僅需 10 分鐘即可完成的 3D 瀏覽器遊戲開發任務，在 GPT-5.6 上耗時超過 60 分鐘。AI 測試者 Chetas Lua 指出：

GPT 5.6 Pro 在 3D 測試中持續超越 Anthropic 的 Fable 5，且能一次性完成遊戲開發，但回應時間已拉長至 20 到 40 分鐘，回到了 5.5 Pro 發布前的狀態。

並非所有測試結果都一面倒。AI 基準測試者 Chris 進行了太空船建模測試，發現 GPT-5.6 耗時 87 分鐘，遠高於 GPT-5.5 Extra High 的 34 分鐘，且在核心幾何結構的處理上，仍略遜於 Fable 5 模型。

市場競爭與發布傳聞

關於 GPT-5.6 的規格傳言四起，據稱其知識庫截止日期已推遲至 2025 年 12 月，且被稱為「Juice Value」的推理努力設定值從 768 提升至 960。雖然 OpenAI 官方未證實任何細節，但據《The Information》報導，OpenAI 首席科學家 Jakub Pachocki 曾向內部員工透露，下一代模型將比 GPT-5.5 有顯著進步。

OpenAI 此時加速推動新模型，背景因素可能與市場競爭有關。中國的開源模型 GLM-5.2 在工程專案基準測試中已超越 GPT-5.5；同時，Anthropic 的旗艦模型 Fable 5 因出口管制與漏洞問題暫時受限，市場出現了高階模型的競爭空窗期。此外，據《華爾街日報》報導，由於面臨 IPO 壓力，OpenAI 正評估調降開發者與企業用戶的 API 費用，以應對與 Anthropic 的價格競爭。

目前 Polymarket 預測市場顯示，該模型在 6 月 22 日至 28 日間發布的合約價格已飆升至 89%，顯示市場對其發布時程的高度期待。

OpenAI 疑似秘密測試 GPT-5.6：回應速度變慢、推理能力卻顯著提升

編輯核心觀點

回應速度變慢，但推理與設計能力提升

市場競爭與發布傳聞

資料來源

相關文章

OpenRouter 推 Fusion API：用「AI 聯合艦隊」挑戰 Claude 5，成本砍半效能不打折

諾貝爾獎得主約翰·詹珀跳槽Anthropic：Google DeepMind人才流失警鐘大作，AI戰局再添變數

諾貝爾獎得主出走！AlphaFold 核心推手 John Jumper 離開 Google DeepMind 加入 Anthropic

加密錢包 Phantom 擴張交易版圖，延攬 Hyperliquid 永續合約團隊 Ventuals