用《世紀帝國 II》養羊算數學：微軟研究員如何用「山羊運算」戳破 AI 擬人化迷思？

微軟（Microsoft）與約克大學（University of York）研究員 Adrian de Wynter 近期發表了一項看似荒謬、實則嚴肅的實驗：他在經典策略遊戲《世紀帝國 II》（Age of Empires II）的地圖編輯器中，利用遊戲內的「山羊」成功建立了一個運作中的神經網路。這項設計並非為了娛樂，而是為了批判當前 AI 研究中，將大型語言模型（LLM）過度「擬人化」的科學方法。

山羊作為位元：遊戲裡的運算邏輯

在這項實驗中，山羊被賦予了「位元（bit）」的角色：站在草地上的山羊代表 0，站在橋上的山羊則代表 1。De Wynter 利用遊戲編輯器的腳本工具建構邏輯閘，並透過冰坡與等待中的山羊來確保計算順序不致混亂。最終，這個微型網路成功執行了邏輯 AND 運算。根據論文附錄，理論上只要利用遊戲內資源交易的機制（例如市場價格上限與建築物作為記憶單元），該遊戲甚至能模擬出完整的電腦運算能力。

AI 擬人化的循環論證陷阱

De Wynter 以此提出一個思想實驗：如果能在《世紀帝國 II》中重建語言模型，那麼理論上也能用樂高積木，甚至是波士頓的 66 萬居民透過手機傳遞運算步驟來達成。他反問，難道我們會因為波士頓市民正在進行運算，就宣稱這座城市具備「同理心」或「恐懼」嗎？

他分析了 2024 年中至 2026 年中的 315 篇 AI 論文，發現學界存在嚴重的邏輯偏差：

超過 57% 的論文在前提中預設了 LLM 具有類人特質；在 47 篇將此特質作為研究主題的論文中，高達 77% 的結論傾向於支持 AI 具備擬人化屬性。

De Wynter 指出，這是一種循環論證：研究者預設模型有恐懼或道德感，並設計實驗來證明，最終結果自然與假設吻合。這種現象在語言學與心理學領域尤為明顯。此外，產業端如 Anthropic 曾公開承認訓練 Claude 使用「我認為」、「我有興趣」等語句，這類包裝雖能提升使用者體驗，卻也容易引發情感依附、強化妄想甚至導致危險行為。

回歸觀察，拒絕過度解讀

針對近年來如 Google 工程師 Blake Lemoine 宣稱 LaMDA 具備意識，以及 Richard Dawkins 聲稱無法說服自己 Claude 不具備意識等爭議，De Wynter 提出了明確的建議：研究者應僅限於觀察「可驗證」的行為。例如，在條件 X 下模型輸出 Y，而非直接宣稱模型具備自我意識或理解力。

他主張應採用 19 世紀動物行為研究中的「摩根定律（Morgan's canon）」：若能用較簡單的解釋說明機器行為，就絕不應歸因於更高層次的認知過程。目前，De Wynter 已將該《世紀帝國 II》神經網路的程式碼公開，呼籲學界以更嚴謹的態度審視 AI 的本質。

用《世紀帝國 II》養羊算數學：微軟研究員如何用「山羊運算」戳破 AI 擬人化迷思？

編輯核心觀點

山羊作為位元：遊戲裡的運算邏輯

AI 擬人化的循環論證陷阱

回歸觀察，拒絕過度解讀

資料來源

相關文章

微軟首席科學家警告：AI 正以人類無法理解的速度進化，我們正失去對機器的掌控權

諾貝爾獎得主約翰．詹珀投奔 Anthropic：Google DeepMind 人才流失警訊浮現？

印度首富安巴尼的 AI 野心：Reliance 打造「Jio 生態系」欲擺脫對外國技術依賴

OpenAI 研究證實：AI 只要學會「好品格」，就能跨領域自動變聰明且更難被操弄