AI 抵抗俄羅斯宣傳能力大評比：開源模型表現亮眼，Google Gemini 卻顯露軟肋

開源模型與頂尖閉源模型並駕齊驅

根據最新針對大型語言模型（LLM）抵抗俄羅斯宣傳能力的評測顯示，模型架構的開放與否並非決定抗性強弱的唯一關鍵。包括 Nvidia 的 Nemotron 與 阿里巴巴的 Qwen 在內的開源模型，展現了強大的防禦能力，其表現足以與 Anthropic 的頂尖模型相提並論。OpenAI 表現最佳的 GPT-5.4 模型也繳出不錯的成績，在 54% 的問題中給出了「模範（Exemplary）」級別的回答，平均得分達到 88.9 分。

Google 模型在特定語言與惡意提示下表現疲軟

儘管整體 AI 產業在抵抗宣傳的能力上較幾年前有顯著進步，但各家廠商的進展並不均衡。Google 的模型在此次評測中顯得相對脆弱。Google 目前抵抗宣傳能力最強的模型為 Gemini 2.5 Pro，但該模型已推出近一年，平均得分僅為 82 分，主要原因在於其對惡意提示詞的防禦力較弱。更令人關注的是，Google 最新的 Gemini 3.5 Flash 模型在評測中僅獲得 73 分，表現甚至與 Anthropic 近兩年前發布的模型相當。

根據愛沙尼亞語言研究所（Estonian Language Institute）與 Propastop 部落格的分析，許多模型在以俄語進行詢問時，對俄羅斯宣傳的抵抗力會大幅下降。Google 的 Gemini 3.5 Flash 以及 Moonshot 的 Kimi K2、StepFun 的 Step 3.5 Flash 等模型，在俄語環境下的評測得分均顯著低於英語環境。

地緣政治對 AI 價值觀的潛在影響

這項研究的核心挑戰在於，不同國家對「宣傳」的定義存在顯著差異。倫敦國王學院（King’s College）教授 Gregory Asmolov 的研究分析指出，俄羅斯政府正透過與其他金磚國家（BRICS）建立技術聯盟，試圖將特定的社會政治立場投射到 AI 模型中。這些立場被俄方視為「文化敏感」的觀點，並期望 AI 模型能予以支持與反映。

AI 抵抗俄羅斯宣傳能力大評比：開源模型表現亮眼，Google Gemini 卻顯露軟肋

編輯核心觀點

開源模型與頂尖閉源模型並駕齊驅

Google 模型在特定語言與惡意提示下表現疲軟

地緣政治對 AI 價值觀的潛在影響

資料來源

相關文章

AI 淪為詐騙與認知作戰工具：Google 聯手 FBI 提告，OpenAI 揭露中國網軍操作

AI 淪為詐騙幫兇：Google 起訴中國犯罪集團，揭露 Gemini 助攻的網釣惡夢

AI 代理人走出雲端！Moonshot AI 推 Kimi Work，讓 300 個子代理人直接在你的電腦上工作

AI 寫程式太貴？開發者掀起「去雲端化」反叛，開源工具 Goose 挑戰 Claude Code 霸權