Z.ai 發布 GLM-5.2：挑戰 100 萬 Token 上下文極限，主打開發者代理自動化

100 萬 Token 帶來的開發變革

Z.ai 於 2026 年 6 月 13 日正式推出 GLM-5.2，這是該公司在短短四個月內發布的第四款旗艦級程式碼模型。此次更新的核心亮點在於其 100 萬 Token 的上下文視窗（glm-5.2[1m]），相較於前代 GLM-5.1 的 20 萬 Token，容量提升了約 5 倍。此外，該模型單次回應的輸出上限達到 131,072 個 Token。

這項規格升級直接改變了程式碼代理（Coding Agent）的運作模式。開發者現在可以將中型規模的整個程式碼庫（Repository）直接載入工作記憶體中，包含原始碼檔案、測試腳本、設定檔與對話紀錄。這種方式消除了以往因上下文限制而必須頻繁進行摘要總結的過程，使代理程式能更精準地追蹤跨檔案的依賴關係。

新增思考模式與架構細節

GLM-5.2 新增了「High」與「Max」兩種思考努力程度（Thinking-Effort）設定。Z.ai 建議在處理複雜、多步驟的程式開發任務時使用「Max」模式。在 Claude Code 環境中，開發者可透過 /effort 指令進行調控，其中 xhigh、max 與 ultracode 等選項皆對應至 GLM-5.2 的 Max 模式。

雖然 Z.ai 在發布資料中未明確揭露架構細節，但根據社群分析，GLM-5 系列基於 7440 億參數的混合專家模型（MoE），每個 Token 啟動 400 億參數。GLM-5.2 延續了此架構，並透過後續訓練進行優化。

發布策略與實作指南

值得注意的是，Z.ai 在此次發布中並未提供任何基準測試分數，如 SWE-bench、Terminal-Bench 或 Code Arena 等數據皆從缺。官方目前將重心放在模型的可用性、上下文容量以及開源路線圖上。

開發者若要將 GLM-5.2 整合至現有工作流，可透過 Anthropic 相容的端點進行替換。以 Claude Code 為例，需編輯 ~/.claude/settings.json，將模型指標指向 glm-5.2[1m] 並調整自動壓縮視窗設定。該模型目前已相容於 Claude Code、Cline、OpenCode 與 OpenClaw 等八種開發代理工具。

GLM-5.2 現已開放給所有 GLM Coding Plan 用戶使用，包含 Lite、Pro、Max 與 Team 等級。

Z.ai 發布 GLM-5.2：挑戰 100 萬 Token 上下文極限，主打開發者代理自動化

編輯核心觀點

100 萬 Token 帶來的開發變革

新增思考模式與架構細節

發布策略與實作指南

資料來源

相關文章

Google Gemini-SQL2 橫掃文字轉 SQL 榜單：自然語言資料庫查詢邁向新里程碑

Moonshot AI 推出 Kimi K2.7-Code：主打軟體工程自動化，推理成本大降 30%

AI 代理人接管第一線人力管理：Orbio 獲 2100 萬美元融資，讓招募到留任全自動化

AI 也能抓駭客？Zcash 透過 Anthropic 模型進行資安審計，未發現重大漏洞