Claude Fable 5 變笨了？其實是「過度敏感」的資安守門員在搞鬼

Claude Fable 5 真的被「閹割」了嗎？

Claude Fable 5 在 7 月 1 日重新上線後，社群媒體上湧現大量批評，用戶紛紛指責模型表現「變笨」、「被閹割」或「無法使用」。然而，針對此現象的兩份權威評測報告卻給出了截然不同的結論：一份顯示效能嚴重崩跌，另一份則認為模型表現幾乎持平。

事實上，這兩份報告都沒有錯，關鍵在於 Anthropic 為該模型部署的全新安全分類器（Safety Classifier）。該機制在 Fable 5 重新上線時被強制啟用，旨在防堵先前被 Amazon 研究人員發現的「越獄」技術，防止模型識別並示範軟體漏洞。

評測數據的落差：是模型變差，還是被轉移了？

AI 評測平台 BridgeMind 進行的「BridgeBench」測試顯示，Fable 5 的除錯（Debugging）分數從 86.2 暴跌至 25.9，重構（Refactoring）與抗幻覺能力也顯著下滑。然而，這並非模型本身能力退化，而是因為在 12 項 TypeScript 除錯任務中，有 9 項被安全分類器攔截，並強制轉向 Claude Opus 4.8 執行。由於 BridgeBench 將任何非目標模型的回答視為零分，導致評測結果出現嚴重偏差。

相比之下，採用盲測人類偏好投票的 Arena.AI 則呈現不同面貌：