WebBrain 開源 AI 瀏覽器代理:支援本地運行、自動化操作,隱私與功能兼顧
編輯核心觀點
- ✦WebBrain 是一款開源的瀏覽器 AI 代理,支援 Chrome 與 Firefox,並能透過本地模型確保瀏覽數據不外流。
- ✦透過「Ask」與「Act」雙模式設計,該工具能執行從資料擷取到跨頁面自動化操作的複雜任務。
- ✦開發者 Emre Sokullu 採用 MIT 授權,並針對安全性設計了 UI 操作優先原則,避免直接調用 API 帶來的風險。

什麼是 WebBrain?
由 Emre Sokullu 開發的 WebBrain 是一款免費且開源的瀏覽器 AI 代理,適用於 Chrome 與 Firefox。與市面上多數依賴雲端服務的 AI 外掛不同,WebBrain 具備「本地優先(Local-First)」特性,使用者可選擇將其連接至本地運行的模型,確保網頁瀏覽數據不會離開個人電腦。
WebBrain 整合於瀏覽器的側邊欄(Side Panel),每個分頁皆擁有獨立的對話紀錄,且不會儲存任何外部數據或進行遙測。該工具支援多種語言,包括英文、西班牙文、法文、土耳其文以及中文。
雙模式運作機制:Ask 與 Act
WebBrain 設有兩種核心模式以平衡安全性與功能性:
- Ask 模式(唯讀):透過一般的內容腳本(Content Scripts)讀取網頁內容,無法對網頁進行任何變更。
- Act 模式(自動化):利用 Chrome DevTools Protocol(透過 chrome.debugger API)驅動網頁,能執行點擊、輸入、捲動與導航等操作。此模式能處理內容腳本無法觸及的跨來源 iframe 與 Shadow DOM。
為確保安全性,Act 模式僅在需要執行動作時才會掛載偵錯器,並會在瀏覽器介面顯示提示。此外,WebBrain 採取「UI 優先」原則,對於提交表單、購買等涉及變更的操作,AI 會優先透過可見的 UI 介面進行,而非直接呼叫 REST 或 GraphQL 端點。
應用場景與效能優化
WebBrain 可應用於多種自動化任務,例如從產品目錄中擷取名稱與價格、總結文章內容、自動填寫表單,或執行跨頁面的導航與研究。為降低雲端 Token 的使用成本,WebBrain 採取了多項優化措施,包括在傳輸前調整並壓縮截圖大小、優先刪除舊的對話紀錄,以及允許使用者搭配輕量級文字模型進行規劃,僅在必要時使用視覺模型。
模型支援與部署
WebBrain 支援廣泛的本地與雲端模型。本地端支援 llama.cpp、Ollama、LM Studio、Jan、vLLM 與 SGLang;雲端端則支援 OpenAI、Anthropic Claude、Gemini、Mistral、DeepSeek、xAI Grok 等多種 API。針對本地運行,開發者建議使用 Qwen 3.6 35B 模型,並建議配置 RTX 4090 或 RTX 5090 等級的顯示卡以獲得最佳效能。
對於不希望自行架設本地環境的使用者,WebBrain 也提供每月 5 美元的託管服務(WebBrain Cloud)。該專案已於 GitHub 開源,並可在 Chrome 線上應用程式商店與 Firefox 附加元件網站下載。



