返回首頁

Anthropic 發布 Claude 5 系列:Fable 與 Mythos 雙模型登場,程式開發與科學研究效能大躍進

編輯核心觀點

  • Anthropic 推出第五代 Claude 模型,Fable 5 主打通用高效能,Mythos 5 則針對資安與科學研究開放特定合作夥伴使用。
  • Fable 5 在程式編寫與科學推理基準測試中大幅領先 Opus 4.8 與 GPT 5.5,並展現出色的視覺處理與自主研究能力。
  • 為防範惡意用途,Anthropic 針對資安、生物與化學領域設置嚴格防護機制,並將敏感查詢導向舊版模型處理。
Anthropic 發布 Claude 5 系列:Fable 與 Mythos 雙模型登場,程式開發與科學研究效能大躍進

Claude 5 系列雙模型:通用與專業的分流策略

Anthropic 正式發表第五代 Claude 模型系列,包含公開版本 Claude Fable 5 與僅限特定合作夥伴使用的 Claude Mythos 5。兩者共享相同的基礎模型架構,但針對不同應用場景配置了截然不同的安全防護層級。Fable 5 內建適用於一般用途的防護機制,而 Mythos 5 則移除了部分針對網路安全、生物與化學領域的限制,僅提供給經過審核的合作夥伴。

程式開發與科學研究的效能突破

根據 Anthropic 的數據,Fable 5 在多項基準測試中表現優異。在 SWE-Bench Pro 測試中,Fable 5 達到 80.3% 的準確率,顯著高於 Claude Opus 4.8 的 69.2% 以及 GPT 5.5 的 58.6%。在處理高難度程式任務的 FrontierCode 基準測試中,Fable 5 取得 29.3% 的成績,遠超 Opus 4.8 的 13.4% 與 GPT 5.5 的 5.7%。

實際應用案例方面,支付處理商 Stripe 指出,Fable 5 將原本需要五個月的工程工作壓縮至數日內完成,成功將包含 5,000 萬行程式碼的 Ruby 專案完成遷移。在科學研究領域,Mythos 5 展現了自主研究潛力,在蛋白質設計流程中,該模型在無人類協助下,成功選定結合位點並執行設計工具,九個蛋白質目標中有七個產出了具潛力的藥物候選物。

資安防護與使用限制

儘管效能提升,Anthropic 對於 Mythos 5 的「代理型駭客(agentic hacking)」能力表示高度關注。為了降低惡意攻擊風險,Anthropic 透過 Project Glasswing 計畫與美國政府合作,僅開放給受信任的資安防禦者使用。針對公開的 Fable 5,Anthropic 設置了嚴格的分類器,若系統偵測到敏感的資安或生物化學查詢,會自動將請求導向較舊的 Claude Opus 4.8 模型,並向使用者發出警告。

Anthropic 坦言,這些防護機制設定得「比理想中更嚴格」,可能會導致少於 5% 的正常請求被誤判拒絕。此外,在定價方面,Fable 5 與 Mythos 5 的價格皆為每百萬輸入代幣 10 美元、每百萬輸出代幣 50 美元,相較於 Claude Opus 4.8 的價格結構有顯著調整。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章