用《世紀帝國 II》養羊算數學:微軟研究員如何用「山羊運算」戳破 AI 擬人化迷思?
編輯核心觀點
- ✦微軟研究員 Adrian de Wynter 在《世紀帝國 II》地圖編輯器中建立神經網路,藉此證明 AI 模型僅是執行數學運算的工具,而非具備意識的生命體。
- ✦研究分析 315 篇 AI 學術論文發現,超過半數研究在前提中預設了 AI 擁有類人特質,導致研究邏輯陷入循環論證的陷阱。
- ✦該研究呼籲學界回歸科學觀察,避免將 AI 的流暢對話誤解為情感或自我意識,並強調應遵循「奧卡姆剃刀」原則解釋機器行為。

微軟(Microsoft)與約克大學(University of York)研究員 Adrian de Wynter 近期發表了一項看似荒謬、實則嚴肅的實驗:他在經典策略遊戲《世紀帝國 II》(Age of Empires II)的地圖編輯器中,利用遊戲內的「山羊」成功建立了一個運作中的神經網路。這項設計並非為了娛樂,而是為了批判當前 AI 研究中,將大型語言模型(LLM)過度「擬人化」的科學方法。
山羊作為位元:遊戲裡的運算邏輯
在這項實驗中,山羊被賦予了「位元(bit)」的角色:站在草地上的山羊代表 0,站在橋上的山羊則代表 1。De Wynter 利用遊戲編輯器的腳本工具建構邏輯閘,並透過冰坡與等待中的山羊來確保計算順序不致混亂。最終,這個微型網路成功執行了邏輯 AND 運算。根據論文附錄,理論上只要利用遊戲內資源交易的機制(例如市場價格上限與建築物作為記憶單元),該遊戲甚至能模擬出完整的電腦運算能力。
AI 擬人化的循環論證陷阱
De Wynter 以此提出一個思想實驗:如果能在《世紀帝國 II》中重建語言模型,那麼理論上也能用樂高積木,甚至是波士頓的 66 萬居民透過手機傳遞運算步驟來達成。他反問,難道我們會因為波士頓市民正在進行運算,就宣稱這座城市具備「同理心」或「恐懼」嗎?
他分析了 2024 年中至 2026 年中的 315 篇 AI 論文,發現學界存在嚴重的邏輯偏差:
超過 57% 的論文在前提中預設了 LLM 具有類人特質;在 47 篇將此特質作為研究主題的論文中,高達 77% 的結論傾向於支持 AI 具備擬人化屬性。
De Wynter 指出,這是一種循環論證:研究者預設模型有恐懼或道德感,並設計實驗來證明,最終結果自然與假設吻合。這種現象在語言學與心理學領域尤為明顯。此外,產業端如 Anthropic 曾公開承認訓練 Claude 使用「我認為」、「我有興趣」等語句,這類包裝雖能提升使用者體驗,卻也容易引發情感依附、強化妄想甚至導致危險行為。
回歸觀察,拒絕過度解讀
針對近年來如 Google 工程師 Blake Lemoine 宣稱 LaMDA 具備意識,以及 Richard Dawkins 聲稱無法說服自己 Claude 不具備意識等爭議,De Wynter 提出了明確的建議:研究者應僅限於觀察「可驗證」的行為。例如,在條件 X 下模型輸出 Y,而非直接宣稱模型具備自我意識或理解力。
他主張應採用 19 世紀動物行為研究中的「摩根定律(Morgan's canon)」:若能用較簡單的解釋說明機器行為,就絕不應歸因於更高層次的認知過程。目前,De Wynter 已將該《世紀帝國 II》神經網路的程式碼公開,呼籲學界以更嚴謹的態度審視 AI 的本質。


