Moonshot AI 推出 Kimi K2.7-Code:主打軟體工程自動化,推理成本大降 30%
編輯核心觀點
- ✦Moonshot AI 發布專為軟體工程設計的 Kimi K2.7-Code 模型,在 Kimi Code Bench v2 評測中較前代提升 21.8% 效能。
- ✦該模型採用混合專家架構(MoE),並透過優化推理過程,使推理代幣使用量減少約 30%,有效降低長流程開發任務的成本。
- ✦模型權重以 Modified MIT 授權釋出,支援自建部署,並具備 256K 上下文視窗及多模態輸入能力。

專注軟體工程的代理模型
Moonshot AI 本週正式推出 Kimi K2.7-Code,這是一款專為軟體工程任務打造的代理(Agentic)模型。與一般通用對話模型不同,K2.7-Code 的設計核心在於處理長週期的軟體開發流程,包括規劃、程式碼編輯、工具調用以及跨步驟的除錯任務。
在架構上,K2.7-Code 採用了混合專家模型(MoE),總參數規模達 1 兆(1T),每個 Token 激活 320 億參數。該模型包含 61 層結構,並整合了 MoonViT 視覺編碼器,使其具備處理影像與影片輸入的能力。此外,模型原生支援 INT4 量化,上下文視窗長度達 256K Tokens。
效能與推理效率的雙重優化
根據 Moonshot AI 官方發布的數據,K2.7-Code 在多項程式碼基準測試中均超越前代 K2.6。其中,在 Kimi Code Bench v2 測試中,分數從 50.9 提升至 62.0,漲幅達 21.8%。
K2.7-Code 在 MCP Mark Verified 基準測試中取得 81.1 分,超越了 Claude Opus 4.8 的 76.4 分。
除了效能提升,Moonshot AI 強調了該模型的推理代幣效率。官方報告指出,K2.7-Code 的推理代幣使用量較 K2.6 減少了約 30%。對於需要執行數百甚至數千個步驟的代理任務而言,這項改進能顯著降低輸出成本,並加快互動式 CLI(命令列介面)的執行速度。
應用場景與部署限制
K2.7-Code 主要針對四大應用場景:倉庫規模(Repo-scale)的重構、程式碼審查、MCP 工具工作流以及長文本分析。開發者可透過 Kimi API 或 Kimi Code 平台存取該模型。
值得注意的是,該模型在部署與使用上有嚴格的限制:
- 強制推理模式:無法關閉思考模式,若嘗試關閉將導致 API 錯誤。
- 固定採樣參數:溫度(Temperature)固定為 1.0,top_p 為 0.95,且不允許修改,否則會觸發錯誤。
- 部署門檻:模型權重檔案大小約 595 GB,屬於伺服器等級的部署目標,不適合筆記型電腦運行。
- 工具調用規則:在多步驟工具調用中,必須保留 reasoning_content,否則後續請求將會失敗。
開發者可透過 vLLM、SGLang 或 KTransformers 進行自建部署。目前所有效能數據均由 Moonshot AI 官方提供,獨立的第三方評測結果尚待觀察。



