告別 AI 代理多工混亂！Databricks 開源 Omnigent，打造一站式「元協調器」讓開發者效率翻倍

在人工智慧（AI）快速發展的時代，工程師們經常需要同時操作多個 AI 代理（AI Agent），例如 Claude Code、Codex 或 Pi 等，在不同的程式碼代理、搜尋工具、文件與通訊軟體之間來回複製貼上，不僅耗時費力，也容易造成混亂，因為每個代理工具通常只理解自己的會話內容。為了解決這項挑戰，數據分析與 AI 巨頭 Databricks 正式開源了名為 Omnigent 的「元協調器」（meta-harness）專案，旨在提供一個統一的平台，讓開發者能更有效率地組合、管理與協作多個 AI 代理。

Omnigent 專案在 Apache 2.0 授權下發布，由 Databricks 的 AI 團隊與 Neon 共同打造。它並非取代現有的 AI 代理，而是扮演一個更高層級的「元協調器」，將每個代理工具視為一個大型系統中可互換的組件。簡單來說，如果說「harness」是將模型轉化為代理的包裝器，那麼 Omnigent 則是在這些包裝器之上，提供一個共享層，讓代理之間的組合、控制與協作成為可能。

Omnigent 如何運作？統一介面與智慧協調

Omnigent 的設計核心基於一個關鍵觀察：無論代理工具內部如何呼叫其模型，其使用者介面（user-facing interface）都是一致的——輸入訊息和檔案，輸出文字串流和工具呼叫。Omnigent 標準化了這個介面，使得不同的代理工具得以互換使用。

這套架構由兩大部分組成：

執行器（Runner）：將任何代理工具包裝在一個沙盒會話中，提供統一的應用程式介面（API）。
伺服器（Server）：提供策略管理與共享功能，並透過終端機、應用程式和網路 API 暴露每個會話。

這意味著，開發者只需一個指令即可在終端機啟動會話，同時也會在本地啟動一個網頁使用者介面（UI）。無論是在瀏覽器或手機上，同一個會話都能保持同步，訊息、子代理、終端機和檔案都能即時更新。首次執行時，Omnigent 還能自動偵測環境中已存在的模型憑證，簡化設定流程。

三大核心能力：組合、控制、協作

Databricks 團隊將 Omnigent 的核心能力歸納為三大面向：

1. 組合（Composition）

Omnigent 讓開發者無需重寫程式碼，即可輕鬆組合不同的模型、代理工具和技術。透過簡單的一行程式碼修改，就能在 Claude Code、Codex、Pi 和自訂代理之間自由切換，大幅提升開發彈性與效率。

2. 控制（Control）

Omnigent 提供具備狀態感知（stateful）和情境感知（contextual）的策略，在元協調器層級而非透過提示詞（prompts）來追蹤代理的行為並實施防護措施。例如，它可以設定在代理支出每 100 美元後暫停運作，等待人工審核；或是在代理安裝新的 npm 套件後，要求人工批准才能執行 Git Push 操作，有效管理成本與潛在風險。

3. 協作（Collaboration）

透過 URL 分享，團隊成員可以即時觀看代理的工作進度，並與其進行即時對話。他們可以在檔案上留言、共同驅動會話，甚至分岔（fork）對話流程，實現前所未有的團隊協作模式。

這些功能都建立在一個名為 Omnibox 的作業系統沙盒（OS sandbox）基礎之上。Omnibox 能夠鎖定作業系統的存取權限，並轉換網路請求。例如，它可以確保 GitHub 權杖（token）對代理保持隱藏，只在經批准的請求中，透過出站代理（egress proxy）注入，大幅提升安全性。

實際應用案例與示範

Omnigent 專案儲存庫中附帶了兩個範例代理，展示其強大功能：

Polly：這是一個多代理程式碼協調器。它本身不撰寫程式碼，而是負責規劃任務，然後將工作委派給平行 Git 工作樹（git worktrees）中的多個程式碼子代理。每個程式碼差異（diff）都會被路由到與作者不同供應商的審閱者進行審查，最終再合併結果。
Debby：這是一個具備「雙頭」的腦力激盪夥伴，一頭是 Claude，另一頭是 GPT。每個問題都會同時發送給兩者，並並排顯示答案。輸入 /debate 指令後，兩個「頭腦」會互相批評，最終達成共識。

其他實用模式也遵循類似的架構，例如一個「前沿顧問模型」（frontier advisor model）可以指導一個成本較低的開源工作者；一個主代理可以協調多個平行運作的子代理；不同的 LLM 可以在同一個工作流程中分別處理規劃、搜尋和程式碼生成等任務。

Marktechpost 團隊也提供了一個互動式概念演示，讓使用者親身體驗 Omnigent 的元協調器工作流程。在這個模擬中，使用者為 Polly 協調器選擇一個任務，Polly 會進行規劃，並將任務委派給三個平行運作的子代理：Claude Code、Codex 和 Pi，並即時串流它們的執行步驟。會話成本計量器會隨著工作進度增加，同時兩個策略開關展示了 Omnigent 的控制層：成本預算策略會在達到 3 美元時暫停執行，等待使用者批准；而情境策略則會在 npm 安裝後阻止 Git Push 操作，直到使用者允許。子代理完成後，每個程式碼差異都會由與作者不同供應商的審閱者進行交叉審查，然後標記為可合併。終端機、網頁和行動裝置介面都顯示相同的會話保持同步。值得注意的是，這是一個說明性模擬，並未實際呼叫任何即時模型。

Omnigent 與單一代理工具的差異

相較於單一的代理工具（例如 Claude Code），Omnigent 元協調器提供了顯著的優勢：

代理與模型：單一代理工具通常只能在其內部切換模型，而 Omnigent 則能讓 Claude Code、Codex、Pi、各種 SDK 甚至自訂代理之間互換使用。
切換成本：在單一工具中重新整合不同功能成本較高，Omnigent 僅需一行程式碼修改。
介面：單一工具通常只有終端機或其專屬 UI，Omnigent 則提供終端機、網頁、桌面、行動裝置和 API，且會話保持同步。
治理：單一工具多以允許/拒絕列表或提示詞為基礎，Omnigent 則在元協調器層級提供具備狀態感知的情境策略。
成本控制：單一工具需手動追蹤，Omnigent 可透過預算策略在設定閾值時暫停。
協作：單一工具需手動複製貼上，Omnigent 支援即時共享會話、共同驅動和分岔對話。
沙盒：單一工具的沙盒功能依賴工具本身，Omnigent 提供 OS 沙盒加上出站代理的秘密注入。
雲端執行：單一工具多在本地機器執行，Omnigent 可利用拋棄式模組或 Daytona 沙盒。
授權：Omnigent 為 Apache 2.0 開源。

若要開始使用 Omnigent，開發者需要 Python 3.12+、Node.js 22 LTS 和 tmux。一個指令即可安裝所有必要的組件。

為什麼這很重要？

Databricks 開源 Omnigent 不僅為 AI 代理的開發與管理帶來了革命性的解決方案，更為複雜的 AI 工作流程提供了一個統一、安全且高效的協作平台。隨著 AI 代理在軟體開發、數據分析乃至各行各業中扮演越來越重要的角色，Omnigent 有望大幅降低開發者整合與管理多個 AI 工具的門檻，加速 AI 應用的創新與落地，同時透過精細的控制策略，有效管理資源成本與潛在風險，為企業級 AI 部署奠定更穩固的基礎。