返回首頁

美團「隱形」AI 模型 LongCat-2.0 揭曉:挑戰 GPT-5.5 的高性價比算力黑馬

編輯核心觀點

  • 美團正式公開 LongCat-2.0 模型,該模型先前以「Owl Alpha」為名在 OpenRouter 匿名測試並取得亮眼呼叫量。
  • LongCat-2.0 是首個全流程在中國國產加速器上完成預訓練與部署的 1.6 兆參數模型,展現了脫離美製硬體訓練大型模型的技術穩定性。
  • 其 API 定價極具競爭力,每百萬輸入 Token 僅需 0.75 美元,在程式碼編寫與代理任務的基準測試中表現優異,性價比成為其核心優勢。
美團「隱形」AI 模型 LongCat-2.0 揭曉:挑戰 GPT-5.5 的高性價比算力黑馬

美團的「隱形」戰略:從 Owl Alpha 到 LongCat-2.0

中國科技巨頭美團(Meituan)於 6 月 30 日正式揭開了 LongCat-2.0 的神秘面紗。這款擁有 1.6 兆參數的混合專家模型(MoE),此前已在 OpenRouter 平台上以「Owl Alpha」的匿名代號運行了兩個月。在正式公開前,該模型已憑藉優異的性能,在 Hermes Agent 工作空間位居呼叫量第一,並在 Claude Code 與 OpenClaw 部署中分別佔據第二與第三名。

LongCat-2.0 的技術架構採用了動態激活機制,根據查詢需求,每個 Token 激活的參數規模約在 330 億至 560 億之間,平均約為 480 億參數。這不僅是美團的技術突破,更是中國 AI 產業的重要里程碑:這是首個完全在中國國產加速器上完成預訓練與部署的兆級參數模型。美團指出,整個預訓練過程橫跨超過 5 萬枚國產加速器,處理了超過 35 兆個 Token,且過程中「沒有發生回滾或不可恢復的損失峰值」,證明了在非美製硬體堆疊上進行大規模訓練的穩定性。

價格戰優勢與實際應用表現

在定價策略上,LongCat-2.0 採取了極具侵略性的定價。標準 API 存取費用為每百萬輸入 Token 0.75 美元、輸出 Token 2.95 美元。相比之下,GPT-5.5 的定價分別為 5 美元與 30 美元,Claude Sonnet 5 的入門價則為 2 美元與 10 美元。目前美團更提供促銷價,將費用降至 0.30 美元與 1.20 美元,且快取上下文讀取免費。

根據《Decrypt》的實測,LongCat-2.0 在遊戲開發任務中表現稱職,儘管在處理高難度邏輯(如敵人數量增加時的目標切換)時略顯不穩定,但其「性價比」極高,非常適合開發者進行多次迭代測試。在基準測試方面,LongCat-2.0 在 SWE-bench Pro 取得 59.5 分,超越了 GPT-5.5 的 58.6 分;在 FORTE 辦公任務測試中則獲得 73.2 分,與 Claude Opus 4.6 持平。

技術亮點:效率與理解力的提升

為了在不大幅增加模型體積的前提下提升性能,美團導入了幾項關鍵技術:

  • 稀疏注意力機制(Sparse Attention):參考 DeepSeek 設計,僅專注於長對話中最相關的部分,提升響應速度。
  • N-gram 嵌入系統:將常見詞組視為單一概念處理,而非拆解為單詞,大幅提升語言理解深度。
  • 專家路由機制:整合了工具使用(Agent)、問題解決(Reasoning)與對話(Interaction)三個專門系統,根據請求類型動態指派處理單元。

目前,開發者可透過相容 OpenAI 與 Anthropic 的 API 端點存取該模型。儘管美團尚未公佈模型權重的開源日期,但對於追求高容量、低成本的程式碼代理(Coding Agent)開發者而言,LongCat-2.0 已成為市場上極具吸引力的替代方案。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章