當 AI 代理人成群結隊：Google DeepMind 投入千萬美元，防範「多代理人系統」引發數位混亂

AI 代理人協作的隱憂：從單體到群體的風險

隨著 Google 在上個月的 I/O 大會上將「代理人（Agent）」工具列為核心策略，Google DeepMind 對於未來數百萬個 AI 代理人同時運作的場景感到擔憂。為了預防潛在的失控風險，Google DeepMind 宣布與 Schmidt Sciences、英國政府的 ARIA、Cooperative AI 基金會以及 Google.org 合作，共同設立 1,000 萬美元的專項資金，用於研究多代理人系統（Multi-agent systems）的行為模式。

Google DeepMind 的研究人員 Shah 指出，目前學術界尚未建立一套完整的「多代理人安全」研究領域，而這正是該基金希望填補的缺口。他表示：

學術界的優勢在於能看得更遠，並進行那些在產業實驗室中並非優先事項的研究。

從網路詐騙到系統性失控

Shah 與 Schmidt Sciences 的「可信賴 AI 科學計畫」負責人 James Fox 認為，當 AI 代理人被大規模部署至經濟活動中，現有的網路威脅可能被「超級化」。這些風險包括大規模的自動化詐騙、提示詞注入（Prompt Injection）攻擊，以及將 AI 代理人轉變為自動化惡意軟體的風險。

Fox 強調，數位公共空間是現代社會運作的基礎，必須確保這些系統不會陷入絕對的無政府狀態。儘管目前尚未出現大規模經濟崩潰等極端情境，但研究人員認為，單獨研究單一代理人已不足以預測整體行為。透過大型語言模型（LLM）驅動的代理人並不總是理性行事，當大量代理人同時互動，複雜度將呈現指數級增長。

資安防禦的典範轉移

不僅 Google DeepMind，Anthropic 近期也發布了基於「零信任（Zero Trust）」架構的 AI 代理人部署指南，假設系統隨時可能遭到入侵。以色列資安公司 Akeyless 的共同創辦人兼 CTO Refael Angel 對此表示認同。他指出，過去的資安防禦假設機器執行的是人類撰寫的固定指令，但 AI 代理人完全顛覆了這一點：