告別 AI 代理多工混亂!Databricks 開源 Omnigent,打造一站式「元協調器」讓開發者效率翻倍
編輯核心觀點
- ✦Databricks 推出開源專案 Omnigent,旨在解決工程師同時管理多個 AI 代理(Agent)的效率困境,提供統一的介面與協作平台。
- ✦Omnigent 透過「組合、控制、協作」三大核心功能,讓開發者能輕鬆切換不同 AI 模型與工具,並設定智慧策略來管理成本與操作權限。
- ✦其獨特的沙盒技術與跨介面同步功能,不僅提升安全性,更實現團隊成員即時共享與共同驅動 AI 代理作業流程的可能。

在人工智慧(AI)快速發展的時代,工程師們經常需要同時操作多個 AI 代理(AI Agent),例如 Claude Code、Codex 或 Pi 等,在不同的程式碼代理、搜尋工具、文件與通訊軟體之間來回複製貼上,不僅耗時費力,也容易造成混亂,因為每個代理工具通常只理解自己的會話內容。為了解決這項挑戰,數據分析與 AI 巨頭 Databricks 正式開源了名為 Omnigent 的「元協調器」(meta-harness)專案,旨在提供一個統一的平台,讓開發者能更有效率地組合、管理與協作多個 AI 代理。
Omnigent 專案在 Apache 2.0 授權下發布,由 Databricks 的 AI 團隊與 Neon 共同打造。它並非取代現有的 AI 代理,而是扮演一個更高層級的「元協調器」,將每個代理工具視為一個大型系統中可互換的組件。簡單來說,如果說「harness」是將模型轉化為代理的包裝器,那麼 Omnigent 則是在這些包裝器之上,提供一個共享層,讓代理之間的組合、控制與協作成為可能。
Omnigent 如何運作?統一介面與智慧協調
Omnigent 的設計核心基於一個關鍵觀察:無論代理工具內部如何呼叫其模型,其使用者介面(user-facing interface)都是一致的——輸入訊息和檔案,輸出文字串流和工具呼叫。Omnigent 標準化了這個介面,使得不同的代理工具得以互換使用。
這套架構由兩大部分組成:
- 執行器(Runner):將任何代理工具包裝在一個沙盒會話中,提供統一的應用程式介面(API)。
- 伺服器(Server):提供策略管理與共享功能,並透過終端機、應用程式和網路 API 暴露每個會話。
這意味著,開發者只需一個指令即可在終端機啟動會話,同時也會在本地啟動一個網頁使用者介面(UI)。無論是在瀏覽器或手機上,同一個會話都能保持同步,訊息、子代理、終端機和檔案都能即時更新。首次執行時,Omnigent 還能自動偵測環境中已存在的模型憑證,簡化設定流程。
三大核心能力:組合、控制、協作
Databricks 團隊將 Omnigent 的核心能力歸納為三大面向:
1. 組合(Composition)
Omnigent 讓開發者無需重寫程式碼,即可輕鬆組合不同的模型、代理工具和技術。透過簡單的一行程式碼修改,就能在 Claude Code、Codex、Pi 和自訂代理之間自由切換,大幅提升開發彈性與效率。
2. 控制(Control)
Omnigent 提供具備狀態感知(stateful)和情境感知(contextual)的策略,在元協調器層級而非透過提示詞(prompts)來追蹤代理的行為並實施防護措施。例如,它可以設定在代理支出每 100 美元後暫停運作,等待人工審核;或是在代理安裝新的 npm 套件後,要求人工批准才能執行 Git Push 操作,有效管理成本與潛在風險。
3. 協作(Collaboration)
透過 URL 分享,團隊成員可以即時觀看代理的工作進度,並與其進行即時對話。他們可以在檔案上留言、共同驅動會話,甚至分岔(fork)對話流程,實現前所未有的團隊協作模式。
這些功能都建立在一個名為 Omnibox 的作業系統沙盒(OS sandbox)基礎之上。Omnibox 能夠鎖定作業系統的存取權限,並轉換網路請求。例如,它可以確保 GitHub 權杖(token)對代理保持隱藏,只在經批准的請求中,透過出站代理(egress proxy)注入,大幅提升安全性。
實際應用案例與示範
Omnigent 專案儲存庫中附帶了兩個範例代理,展示其強大功能:
- Polly:這是一個多代理程式碼協調器。它本身不撰寫程式碼,而是負責規劃任務,然後將工作委派給平行 Git 工作樹(git worktrees)中的多個程式碼子代理。每個程式碼差異(diff)都會被路由到與作者不同供應商的審閱者進行審查,最終再合併結果。
- Debby:這是一個具備「雙頭」的腦力激盪夥伴,一頭是 Claude,另一頭是 GPT。每個問題都會同時發送給兩者,並並排顯示答案。輸入
/debate指令後,兩個「頭腦」會互相批評,最終達成共識。
其他實用模式也遵循類似的架構,例如一個「前沿顧問模型」(frontier advisor model)可以指導一個成本較低的開源工作者;一個主代理可以協調多個平行運作的子代理;不同的 LLM 可以在同一個工作流程中分別處理規劃、搜尋和程式碼生成等任務。
Marktechpost 團隊也提供了一個互動式概念演示,讓使用者親身體驗 Omnigent 的元協調器工作流程。在這個模擬中,使用者為 Polly 協調器選擇一個任務,Polly 會進行規劃,並將任務委派給三個平行運作的子代理:Claude Code、Codex 和 Pi,並即時串流它們的執行步驟。會話成本計量器會隨著工作進度增加,同時兩個策略開關展示了 Omnigent 的控制層:成本預算策略會在達到 3 美元時暫停執行,等待使用者批准;而情境策略則會在 npm 安裝後阻止 Git Push 操作,直到使用者允許。子代理完成後,每個程式碼差異都會由與作者不同供應商的審閱者進行交叉審查,然後標記為可合併。終端機、網頁和行動裝置介面都顯示相同的會話保持同步。值得注意的是,這是一個說明性模擬,並未實際呼叫任何即時模型。
Omnigent 與單一代理工具的差異
相較於單一的代理工具(例如 Claude Code),Omnigent 元協調器提供了顯著的優勢:
- 代理與模型:單一代理工具通常只能在其內部切換模型,而 Omnigent 則能讓 Claude Code、Codex、Pi、各種 SDK 甚至自訂代理之間互換使用。
- 切換成本:在單一工具中重新整合不同功能成本較高,Omnigent 僅需一行程式碼修改。
- 介面:單一工具通常只有終端機或其專屬 UI,Omnigent 則提供終端機、網頁、桌面、行動裝置和 API,且會話保持同步。
- 治理:單一工具多以允許/拒絕列表或提示詞為基礎,Omnigent 則在元協調器層級提供具備狀態感知的情境策略。
- 成本控制:單一工具需手動追蹤,Omnigent 可透過預算策略在設定閾值時暫停。
- 協作:單一工具需手動複製貼上,Omnigent 支援即時共享會話、共同驅動和分岔對話。
- 沙盒:單一工具的沙盒功能依賴工具本身,Omnigent 提供 OS 沙盒加上出站代理的秘密注入。
- 雲端執行:單一工具多在本地機器執行,Omnigent 可利用拋棄式模組或 Daytona 沙盒。
- 授權:Omnigent 為 Apache 2.0 開源。
若要開始使用 Omnigent,開發者需要 Python 3.12+、Node.js 22 LTS 和 tmux。一個指令即可安裝所有必要的組件。
為什麼這很重要?
Databricks 開源 Omnigent 不僅為 AI 代理的開發與管理帶來了革命性的解決方案,更為複雜的 AI 工作流程提供了一個統一、安全且高效的協作平台。隨著 AI 代理在軟體開發、數據分析乃至各行各業中扮演越來越重要的角色,Omnigent 有望大幅降低開發者整合與管理多個 AI 工具的門檻,加速 AI 應用的創新與落地,同時透過精細的控制策略,有效管理資源成本與潛在風險,為企業級 AI 部署奠定更穩固的基礎。



