美團「隱形」AI 模型 LongCat-2.0 揭曉：挑戰 GPT-5.5 的高性價比算力黑馬

美團的「隱形」戰略：從 Owl Alpha 到 LongCat-2.0

中國科技巨頭美團（Meituan）於 6 月 30 日正式揭開了 LongCat-2.0 的神秘面紗。這款擁有 1.6 兆參數的混合專家模型（MoE），此前已在 OpenRouter 平台上以「Owl Alpha」的匿名代號運行了兩個月。在正式公開前，該模型已憑藉優異的性能，在 Hermes Agent 工作空間位居呼叫量第一，並在 Claude Code 與 OpenClaw 部署中分別佔據第二與第三名。

LongCat-2.0 的技術架構採用了動態激活機制，根據查詢需求，每個 Token 激活的參數規模約在 330 億至 560 億之間，平均約為 480 億參數。這不僅是美團的技術突破，更是中國 AI 產業的重要里程碑：這是首個完全在中國國產加速器上完成預訓練與部署的兆級參數模型。美團指出，整個預訓練過程橫跨超過 5 萬枚國產加速器，處理了超過 35 兆個 Token，且過程中「沒有發生回滾或不可恢復的損失峰值」，證明了在非美製硬體堆疊上進行大規模訓練的穩定性。

價格戰優勢與實際應用表現

在定價策略上，LongCat-2.0 採取了極具侵略性的定價。標準 API 存取費用為每百萬輸入 Token 0.75 美元、輸出 Token 2.95 美元。相比之下，GPT-5.5 的定價分別為 5 美元與 30 美元，Claude Sonnet 5 的入門價則為 2 美元與 10 美元。目前美團更提供促銷價，將費用降至 0.30 美元與 1.20 美元，且快取上下文讀取免費。

根據《Decrypt》的實測，LongCat-2.0 在遊戲開發任務中表現稱職，儘管在處理高難度邏輯（如敵人數量增加時的目標切換）時略顯不穩定，但其「性價比」極高，非常適合開發者進行多次迭代測試。在基準測試方面，LongCat-2.0 在 SWE-bench Pro 取得 59.5 分，超越了 GPT-5.5 的 58.6 分；在 FORTE 辦公任務測試中則獲得 73.2 分，與 Claude Opus 4.6 持平。

技術亮點：效率與理解力的提升

為了在不大幅增加模型體積的前提下提升性能，美團導入了幾項關鍵技術：

稀疏注意力機制（Sparse Attention）：參考 DeepSeek 設計，僅專注於長對話中最相關的部分，提升響應速度。
N-gram 嵌入系統：將常見詞組視為單一概念處理，而非拆解為單詞，大幅提升語言理解深度。
專家路由機制：整合了工具使用（Agent）、問題解決（Reasoning）與對話（Interaction）三個專門系統，根據請求類型動態指派處理單元。

目前，開發者可透過相容 OpenAI 與 Anthropic 的 API 端點存取該模型。儘管美團尚未公佈模型權重的開源日期，但對於追求高容量、低成本的程式碼代理（Coding Agent）開發者而言，LongCat-2.0 已成為市場上極具吸引力的替代方案。

美團「隱形」AI 模型 LongCat-2.0 揭曉：挑戰 GPT-5.5 的高性價比算力黑馬

編輯核心觀點

美團的「隱形」戰略：從 Owl Alpha 到 LongCat-2.0

價格戰優勢與實際應用表現

技術亮點：效率與理解力的提升

資料來源

相關文章

參數僅 3B 卻能挑戰千億級模型！微博團隊發表 VibeThinker-3B，揭開「推理特化」新路徑

OpenRouter 推 Fusion API：用「AI 聯合艦隊」挑戰 Claude 5，成本砍半效能不打折

OpenAI 文件揭示 GPT-5.6 Pro 新策略：頂級模型不再獨尊，走向三路並進

NVIDIA 發表 SpatialClaw：讓 AI 像工程師一樣「寫程式」解決 3D 空間推理難題