Moonshot AI 推出 Kimi K2.7-Code：主打軟體工程自動化，推理成本大降 30%

專注軟體工程的代理模型

Moonshot AI 本週正式推出 Kimi K2.7-Code，這是一款專為軟體工程任務打造的代理（Agentic）模型。與一般通用對話模型不同，K2.7-Code 的設計核心在於處理長週期的軟體開發流程，包括規劃、程式碼編輯、工具調用以及跨步驟的除錯任務。

在架構上，K2.7-Code 採用了混合專家模型（MoE），總參數規模達 1 兆（1T），每個 Token 激活 320 億參數。該模型包含 61 層結構，並整合了 MoonViT 視覺編碼器，使其具備處理影像與影片輸入的能力。此外，模型原生支援 INT4 量化，上下文視窗長度達 256K Tokens。

效能與推理效率的雙重優化

根據 Moonshot AI 官方發布的數據，K2.7-Code 在多項程式碼基準測試中均超越前代 K2.6。其中，在 Kimi Code Bench v2 測試中，分數從 50.9 提升至 62.0，漲幅達 21.8%。

K2.7-Code 在 MCP Mark Verified 基準測試中取得 81.1 分，超越了 Claude Opus 4.8 的 76.4 分。

除了效能提升，Moonshot AI 強調了該模型的推理代幣效率。官方報告指出，K2.7-Code 的推理代幣使用量較 K2.6 減少了約 30%。對於需要執行數百甚至數千個步驟的代理任務而言，這項改進能顯著降低輸出成本，並加快互動式 CLI（命令列介面）的執行速度。

應用場景與部署限制

K2.7-Code 主要針對四大應用場景：倉庫規模（Repo-scale）的重構、程式碼審查、MCP 工具工作流以及長文本分析。開發者可透過 Kimi API 或 Kimi Code 平台存取該模型。

值得注意的是，該模型在部署與使用上有嚴格的限制：

強制推理模式：無法關閉思考模式，若嘗試關閉將導致 API 錯誤。
固定採樣參數：溫度（Temperature）固定為 1.0，top_p 為 0.95，且不允許修改，否則會觸發錯誤。
部署門檻：模型權重檔案大小約 595 GB，屬於伺服器等級的部署目標，不適合筆記型電腦運行。
工具調用規則：在多步驟工具調用中，必須保留 reasoning_content，否則後續請求將會失敗。

開發者可透過 vLLM、SGLang 或 KTransformers 進行自建部署。目前所有效能數據均由 Moonshot AI 官方提供，獨立的第三方評測結果尚待觀察。

Moonshot AI 推出 Kimi K2.7-Code：主打軟體工程自動化，推理成本大降 30%

編輯核心觀點

專注軟體工程的代理模型

效能與推理效率的雙重優化

應用場景與部署限制

資料來源

相關文章

月之暗面推出 Kimi Work：讓 300 個 AI 代理駐守電腦，直接接管你的瀏覽器與檔案

AI 代理人走出雲端！Moonshot AI 推 Kimi Work，讓 300 個子代理人直接在你的電腦上工作

醫療影像 AI 開發實戰：利用 MONAI 與 3D UNet 構建脾臟分割管線

印度 AI 策略轉向：Avataar 推出的 Varya 模型，如何用 1/27 的成本搶攻在地市場？