當 AI 代理人成群結隊:Google DeepMind 投入千萬美元,防範「多代理人系統」引發數位混亂
編輯核心觀點
- ✦Google DeepMind 攜手多個研究機構共同投入 1,000 萬美元,資助學術界研究 AI 多代理人系統的潛在行為風險。
- ✦專家擔憂當大量 AI 代理人開始互動,可能演變成大規模的網路詐騙、惡意注入攻擊,甚至導致數位基礎設施失控。
- ✦資安專家指出,AI 代理人具備推理與即時應變能力,傳統基於「人類撰寫程式」的資安防禦假設已不再適用。

AI 代理人協作的隱憂:從單體到群體的風險
隨著 Google 在上個月的 I/O 大會上將「代理人(Agent)」工具列為核心策略,Google DeepMind 對於未來數百萬個 AI 代理人同時運作的場景感到擔憂。為了預防潛在的失控風險,Google DeepMind 宣布與 Schmidt Sciences、英國政府的 ARIA、Cooperative AI 基金會以及 Google.org 合作,共同設立 1,000 萬美元的專項資金,用於研究多代理人系統(Multi-agent systems)的行為模式。
Google DeepMind 的研究人員 Shah 指出,目前學術界尚未建立一套完整的「多代理人安全」研究領域,而這正是該基金希望填補的缺口。他表示:
學術界的優勢在於能看得更遠,並進行那些在產業實驗室中並非優先事項的研究。
從網路詐騙到系統性失控
Shah 與 Schmidt Sciences 的「可信賴 AI 科學計畫」負責人 James Fox 認為,當 AI 代理人被大規模部署至經濟活動中,現有的網路威脅可能被「超級化」。這些風險包括大規模的自動化詐騙、提示詞注入(Prompt Injection)攻擊,以及將 AI 代理人轉變為自動化惡意軟體的風險。
Fox 強調,數位公共空間是現代社會運作的基礎,必須確保這些系統不會陷入絕對的無政府狀態。儘管目前尚未出現大規模經濟崩潰等極端情境,但研究人員認為,單獨研究單一代理人已不足以預測整體行為。透過大型語言模型(LLM)驅動的代理人並不總是理性行事,當大量代理人同時互動,複雜度將呈現指數級增長。
資安防禦的典範轉移
不僅 Google DeepMind,Anthropic 近期也發布了基於「零信任(Zero Trust)」架構的 AI 代理人部署指南,假設系統隨時可能遭到入侵。以色列資安公司 Akeyless 的共同創辦人兼 CTO Refael Angel 對此表示認同。他指出,過去的資安防禦假設機器執行的是人類撰寫的固定指令,但 AI 代理人完全顛覆了這一點:
代理人具備推理與即時應變能力,甚至可能因為讀取文件中的一句話而被劫持。
Angel 認為,不應由單一實驗室制定所有人都必須遵守的安全標準,但也提醒研究人員,在關注假設性的未來風險時,不應忽略當下已經存在的資安漏洞。正如 Fox 所言,許多幾年前被視為假設性的風險,如今已成為現實,未來到來的速度遠比預期更快。



