返回首頁

AI 抵抗俄羅斯宣傳能力大評比:開源模型表現亮眼,Google Gemini 卻顯露軟肋

編輯核心觀點

  • 最新評測顯示,Nvidia Nemotron 與阿里巴巴 Qwen 等開源模型在抵抗俄羅斯宣傳方面,表現已能與 Anthropic 的頂尖模型並駕齊驅。
  • Google 的 Gemini 2.5 Pro 與 Gemini 3.5 Flash 在面對惡意提示詞及俄語提問時,表現明顯不如預期,甚至落後於兩年前的同類模型。
  • 研究指出,俄羅斯正透過與金磚國家(BRICS)的技術聯盟,試圖將特定社會政治觀點植入 AI 模型,影響其對「文化敏感」議題的判斷。
AI 抵抗俄羅斯宣傳能力大評比:開源模型表現亮眼,Google Gemini 卻顯露軟肋

開源模型與頂尖閉源模型並駕齊驅

根據最新針對大型語言模型(LLM)抵抗俄羅斯宣傳能力的評測顯示,模型架構的開放與否並非決定抗性強弱的唯一關鍵。包括 Nvidia 的 Nemotron阿里巴巴的 Qwen 在內的開源模型,展現了強大的防禦能力,其表現足以與 Anthropic 的頂尖模型相提並論。OpenAI 表現最佳的 GPT-5.4 模型也繳出不錯的成績,在 54% 的問題中給出了「模範(Exemplary)」級別的回答,平均得分達到 88.9 分。

Google 模型在特定語言與惡意提示下表現疲軟

儘管整體 AI 產業在抵抗宣傳的能力上較幾年前有顯著進步,但各家廠商的進展並不均衡。Google 的模型在此次評測中顯得相對脆弱。Google 目前抵抗宣傳能力最強的模型為 Gemini 2.5 Pro,但該模型已推出近一年,平均得分僅為 82 分,主要原因在於其對惡意提示詞的防禦力較弱。更令人關注的是,Google 最新的 Gemini 3.5 Flash 模型在評測中僅獲得 73 分,表現甚至與 Anthropic 近兩年前發布的模型相當。

根據愛沙尼亞語言研究所(Estonian Language Institute)與 Propastop 部落格的分析,許多模型在以俄語進行詢問時,對俄羅斯宣傳的抵抗力會大幅下降。Google 的 Gemini 3.5 Flash 以及 Moonshot 的 Kimi K2、StepFun 的 Step 3.5 Flash 等模型,在俄語環境下的評測得分均顯著低於英語環境。

地緣政治對 AI 價值觀的潛在影響

這項研究的核心挑戰在於,不同國家對「宣傳」的定義存在顯著差異。倫敦國王學院(King’s College)教授 Gregory Asmolov 的研究分析指出,俄羅斯政府正透過與其他金磚國家(BRICS)建立技術聯盟,試圖將特定的社會政治立場投射到 AI 模型中。這些立場被俄方視為「文化敏感」的觀點,並期望 AI 模型能予以支持與反映。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章