返回首頁

Moonshot AI 推出 Kimi K2.7-Code:主打軟體工程自動化,推理成本大降 30%

編輯核心觀點

  • Moonshot AI 發布專為軟體工程設計的 Kimi K2.7-Code 模型,在 Kimi Code Bench v2 評測中較前代提升 21.8% 效能。
  • 該模型採用混合專家架構(MoE),並透過優化推理過程,使推理代幣使用量減少約 30%,有效降低長流程開發任務的成本。
  • 模型權重以 Modified MIT 授權釋出,支援自建部署,並具備 256K 上下文視窗及多模態輸入能力。
Moonshot AI 推出 Kimi K2.7-Code:主打軟體工程自動化,推理成本大降 30%

專注軟體工程的代理模型

Moonshot AI 本週正式推出 Kimi K2.7-Code,這是一款專為軟體工程任務打造的代理(Agentic)模型。與一般通用對話模型不同,K2.7-Code 的設計核心在於處理長週期的軟體開發流程,包括規劃、程式碼編輯、工具調用以及跨步驟的除錯任務。

在架構上,K2.7-Code 採用了混合專家模型(MoE),總參數規模達 1 兆(1T),每個 Token 激活 320 億參數。該模型包含 61 層結構,並整合了 MoonViT 視覺編碼器,使其具備處理影像與影片輸入的能力。此外,模型原生支援 INT4 量化,上下文視窗長度達 256K Tokens。

效能與推理效率的雙重優化

根據 Moonshot AI 官方發布的數據,K2.7-Code 在多項程式碼基準測試中均超越前代 K2.6。其中,在 Kimi Code Bench v2 測試中,分數從 50.9 提升至 62.0,漲幅達 21.8%。

K2.7-Code 在 MCP Mark Verified 基準測試中取得 81.1 分,超越了 Claude Opus 4.8 的 76.4 分。

除了效能提升,Moonshot AI 強調了該模型的推理代幣效率。官方報告指出,K2.7-Code 的推理代幣使用量較 K2.6 減少了約 30%。對於需要執行數百甚至數千個步驟的代理任務而言,這項改進能顯著降低輸出成本,並加快互動式 CLI(命令列介面)的執行速度。

應用場景與部署限制

K2.7-Code 主要針對四大應用場景:倉庫規模(Repo-scale)的重構程式碼審查MCP 工具工作流以及長文本分析。開發者可透過 Kimi API 或 Kimi Code 平台存取該模型。

值得注意的是,該模型在部署與使用上有嚴格的限制:

  • 強制推理模式:無法關閉思考模式,若嘗試關閉將導致 API 錯誤。
  • 固定採樣參數:溫度(Temperature)固定為 1.0,top_p 為 0.95,且不允許修改,否則會觸發錯誤。
  • 部署門檻:模型權重檔案大小約 595 GB,屬於伺服器等級的部署目標,不適合筆記型電腦運行。
  • 工具調用規則:在多步驟工具調用中,必須保留 reasoning_content,否則後續請求將會失敗。

開發者可透過 vLLM、SGLang 或 KTransformers 進行自建部署。目前所有效能數據均由 Moonshot AI 官方提供,獨立的第三方評測結果尚待觀察。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章