Claude Fable 5 重返市場：Anthropic 強化資安防護，並推動 AI 越獄標準化

Claude Fable 5 恢復服務，資安防護機制升級

在經歷短暫的暫停後，Anthropic 於 7 月 1 日正式重新部署其最強大的通用模型 Claude Fable 5。此前，由於美國政府於 6 月 12 日針對該模型及 Claude Mythos 5 實施出口管制，限制其對非美國籍人士開放，Anthropic 為確保合規性，選擇全面暫停服務。隨著 6 月 30 日管制解除，Fable 5 已全面回歸，而 Mythos 5 則恢復對特定美國組織的授權。

此次暫停的導火線源於亞馬遜（Amazon）研究員的一份報告，指出 Fable 5 的安全防護機制存在被繞過的風險，模型在特定提示詞下會識別軟體漏洞並產出攻擊程式碼。Anthropic 強調，此類風險並非 Fable 5 獨有，經測試發現包括 Claude Opus 4.8、GPT-5.5 及 Kimi K2.7 在內的多款模型均能識別相同漏洞。

導入「防禦縱深」設計，強化安全分類器

為了填補資安漏洞，Anthropic 訓練了一套全新的安全分類器，能阻擋超過 99% 的類似攻擊手法。值得注意的是，系統並非直接拒絕用戶請求，而是將觸發分類器的請求自動導向 Claude Opus 4.8 處理，並同步通知使用者。美國商務部 CAISI 研究人員對此評估認為，該防護機制極為強大，但代價是開發者在進行日常編碼與除錯時，可能會面臨較高的誤判率。

此外，Anthropic 正與亞馬遜、微軟、Google 及 Glasswing 合作夥伴共同制定「越獄嚴重性評分架構（Jailbreak severity framework）」，將從能力增益、能力廣度、武器化難度、可發現性四個維度進行評分，並針對高風險等級採取 24 小時全天候監控。

市場競爭與應用場景

在 Fable 5 暫停期間，智譜 AI（Zhipu AI）發布了開源權重模型 GLM-5.2，憑藉其 Mixture-of-Experts 架構與極高的性價比，迅速成為市場焦點。數據顯示，GLM-5.2 在部分基準測試中表現強勁，且每百萬 token 的成本遠低於 Claude 系列。

儘管面臨競爭，Fable 5 仍鎖定長序列、代理人（Agentic）工作流程，例如 Stripe 已利用該模型在一天內完成 5,000 萬行 Ruby 程式碼的遷移。目前，Fable 5 已整合至 Claude Platform、Claude.ai、Claude Code 及 Claude Cowork，並重新在 AWS、Google Cloud 與 Microsoft Foundry 上線。

Claude Fable 5 重返市場：Anthropic 強化資安防護，並推動 AI 越獄標準化

編輯核心觀點

Claude Fable 5 恢復服務，資安防護機制升級

導入「防禦縱深」設計，強化安全分類器

市場競爭與應用場景

資料來源

相關文章

美國商務部解禁 Anthropic AI 模型：Mythos 與 Fable 重返市場，資安防護成關鍵條件

美國商務部解除禁令，Anthropic AI 模型 Claude Fable 5 將於 7 月 1 日恢復服務

OpenRouter 推 Fusion API：用「AI 聯合艦隊」挑戰 Claude 5，成本砍半效能不打折

與川普政府角力數週，Anthropic 獲准恢復 Claude Fable 5 與 Mythos 5 使用權