返回首頁

Claude Fable 5 重返市場:Anthropic 強化資安防護,並推動 AI 越獄標準化

編輯核心觀點

  • Anthropic 旗艦模型 Claude Fable 5 在美國出口管制解除後,於 7 月 1 日正式恢復全球服務。
  • 針對亞馬遜研究員發現的防護繞過漏洞,Anthropic 導入了全新的安全分類器,能阻擋超過 99% 的違規請求。
  • 面對 AI 模型安全標準的缺失,Anthropic 正聯合多家科技巨頭制定「越獄嚴重性評分架構」,以量化評估 AI 的潛在風險。
Claude Fable 5 重返市場:Anthropic 強化資安防護,並推動 AI 越獄標準化

Claude Fable 5 恢復服務,資安防護機制升級

在經歷短暫的暫停後,Anthropic 於 7 月 1 日正式重新部署其最強大的通用模型 Claude Fable 5。此前,由於美國政府於 6 月 12 日針對該模型及 Claude Mythos 5 實施出口管制,限制其對非美國籍人士開放,Anthropic 為確保合規性,選擇全面暫停服務。隨著 6 月 30 日管制解除,Fable 5 已全面回歸,而 Mythos 5 則恢復對特定美國組織的授權。

此次暫停的導火線源於亞馬遜(Amazon)研究員的一份報告,指出 Fable 5 的安全防護機制存在被繞過的風險,模型在特定提示詞下會識別軟體漏洞並產出攻擊程式碼。Anthropic 強調,此類風險並非 Fable 5 獨有,經測試發現包括 Claude Opus 4.8、GPT-5.5 及 Kimi K2.7 在內的多款模型均能識別相同漏洞。

導入「防禦縱深」設計,強化安全分類器

為了填補資安漏洞,Anthropic 訓練了一套全新的安全分類器,能阻擋超過 99% 的類似攻擊手法。值得注意的是,系統並非直接拒絕用戶請求,而是將觸發分類器的請求自動導向 Claude Opus 4.8 處理,並同步通知使用者。美國商務部 CAISI 研究人員對此評估認為,該防護機制極為強大,但代價是開發者在進行日常編碼與除錯時,可能會面臨較高的誤判率。

此外,Anthropic 正與亞馬遜、微軟、Google 及 Glasswing 合作夥伴共同制定「越獄嚴重性評分架構(Jailbreak severity framework)」,將從能力增益、能力廣度、武器化難度、可發現性四個維度進行評分,並針對高風險等級採取 24 小時全天候監控。

市場競爭與應用場景

在 Fable 5 暫停期間,智譜 AI(Zhipu AI)發布了開源權重模型 GLM-5.2,憑藉其 Mixture-of-Experts 架構與極高的性價比,迅速成為市場焦點。數據顯示,GLM-5.2 在部分基準測試中表現強勁,且每百萬 token 的成本遠低於 Claude 系列。

儘管面臨競爭,Fable 5 仍鎖定長序列、代理人(Agentic)工作流程,例如 Stripe 已利用該模型在一天內完成 5,000 萬行 Ruby 程式碼的遷移。目前,Fable 5 已整合至 Claude Platform、Claude.ai、Claude Code 及 Claude Cowork,並重新在 AWS、Google Cloud 與 Microsoft Foundry 上線。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章