Anthropic 陷「秘密破壞」爭議:Claude 5 隱形限縮政策引發 AI 社群反彈
編輯核心觀點
- ✦Anthropic 原計畫隱蔽地降低 Claude Fable 5 對 AI 開發者的效能,以防競爭對手利用其模型進行訓練,此舉引發 AI 研究社群強烈抨擊。
- ✦在輿論壓力下,Anthropic 已撤回該隱形限制政策,改為採取公開透明的警告機制,若偵測到違規開發行為將直接拒絕或導向較低階模型。
- ✦執行長 Dario Amodei 採取極簡化管理架構,僅設一名直接匯報對象,將營運重擔交由共同創辦人 Daniela Amodei 負責,使其能專注於戰略與研究。

人工智慧公司 Anthropic 近期陷入輿論風暴。該公司原先針對最新模型 Claude Fable 5 實施一項「隱形」安全防護機制,旨在限制競爭對手利用該模型進行 AI 開發訓練。然而,此舉因缺乏透明度,遭致 AI 研究社群嚴厲批評,迫使公司緊急調整策略。
隱形限制引發「破壞」指控
Anthropic 原本的設計是,若系統偵測到使用者意圖利用 Claude Fable 5 進行前沿 AI 開發(此行為違反公司服務條款),系統將在不告知使用者的情況下,刻意降低模型效能。這種「秘密破壞」的做法被外界視為對開發者社群的敵意行為。
degrading performance on ML research *without telling the user* is shockingly hostile and a terrible look.
美國創新基金會(Foundation for American Innovation)資深研究員、前白宮 AI 顧問 Dean Ball 在 X 上直言,這種做法不僅損害了 Anthropic 的公信力,更限制了 AI 研究人員在安全性議題上的合作。開源 AI 新創公司 Prime Intellect 的研究負責人 Will Brown 則表示:
It felt like Anthropic was saying to the public, ‘We don't trust anybody else to do AI research. We are the only ones who have to do AI research. It feels a bit like they’re starting to pull the ladder up behind them.
面對反彈,Anthropic 發布聲明坦承錯誤,表示將改採「公開透明」的防護機制。未來若系統偵測到潛在違規,將會明確通知使用者,並拒絕該請求或將其導向功能較弱的模型。公司解釋,先前選擇隱蔽方式是為了增加繞過防護機制的難度,但承認在平衡安全性與開發者需求上做出了錯誤判斷。
極簡化管理風格
在業務營運之外,Anthropic 執行長 Dario Amodei 的管理結構也成為科技界關注焦點。據《彭博社》報導,Dario Amodei 目前僅有一名直接匯報對象,即其辦公室主任(Chief of Staff)。
公司內部絕大多數的執行團隊成員,均直接向共同創辦人兼總裁、同時也是 Dario Amodei 胞妹的 Daniela Amodei 匯報,由她負責處理日常營運事務。這種結構與 OpenAI 執行長 Sam Altman 約有半打直接匯報對象,或是 Nvidia 執行長黃仁勳擁有數十名直接匯報對象的模式大相逕庭。
Dario Amodei 表示,這種安排讓他能將幾乎所有精力投入在戰略規劃、企業文化、研究方向以及對文明未來的深度思考上。他形容這種管理結構「極度自由」。



