返回首頁

Z.ai 發布 GLM-5.2:挑戰 100 萬 Token 上下文極限,主打開發者代理自動化

編輯核心觀點

  • Z.ai 推出 GLM-5.2 模型,將上下文視窗擴展至 100 萬 Token,並支援高達 131,072 個 Token 的輸出能力。
  • 該模型引入「High」與「Max」兩種思考模式,旨在提升複雜程式碼重構與長週期代理任務的執行效率。
  • 目前官方尚未發布任何基準測試數據,但已開放透過 Anthropic 相容端點,無縫整合至 Claude Code 與 Cline 等開發工具。
Z.ai 發布 GLM-5.2:挑戰 100 萬 Token 上下文極限,主打開發者代理自動化

100 萬 Token 帶來的開發變革

Z.ai 於 2026 年 6 月 13 日正式推出 GLM-5.2,這是該公司在短短四個月內發布的第四款旗艦級程式碼模型。此次更新的核心亮點在於其 100 萬 Token 的上下文視窗(glm-5.2[1m]),相較於前代 GLM-5.1 的 20 萬 Token,容量提升了約 5 倍。此外,該模型單次回應的輸出上限達到 131,072 個 Token。

這項規格升級直接改變了程式碼代理(Coding Agent)的運作模式。開發者現在可以將中型規模的整個程式碼庫(Repository)直接載入工作記憶體中,包含原始碼檔案、測試腳本、設定檔與對話紀錄。這種方式消除了以往因上下文限制而必須頻繁進行摘要總結的過程,使代理程式能更精準地追蹤跨檔案的依賴關係。

新增思考模式與架構細節

GLM-5.2 新增了「High」與「Max」兩種思考努力程度(Thinking-Effort)設定。Z.ai 建議在處理複雜、多步驟的程式開發任務時使用「Max」模式。在 Claude Code 環境中,開發者可透過 /effort 指令進行調控,其中 xhigh、max 與 ultracode 等選項皆對應至 GLM-5.2 的 Max 模式。

雖然 Z.ai 在發布資料中未明確揭露架構細節,但根據社群分析,GLM-5 系列基於 7440 億參數的混合專家模型(MoE),每個 Token 啟動 400 億參數。GLM-5.2 延續了此架構,並透過後續訓練進行優化。

發布策略與實作指南

值得注意的是,Z.ai 在此次發布中並未提供任何基準測試分數,如 SWE-bench、Terminal-Bench 或 Code Arena 等數據皆從缺。官方目前將重心放在模型的可用性、上下文容量以及開源路線圖上。

開發者若要將 GLM-5.2 整合至現有工作流,可透過 Anthropic 相容的端點進行替換。以 Claude Code 為例,需編輯 ~/.claude/settings.json,將模型指標指向 glm-5.2[1m] 並調整自動壓縮視窗設定。該模型目前已相容於 Claude Code、Cline、OpenCode 與 OpenClaw 等八種開發代理工具。

GLM-5.2 現已開放給所有 GLM Coding Plan 用戶使用,包含 Lite、Pro、Max 與 Team 等級。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章