返回首頁

Google 升級 Gemini 企業級 AI:導入「代理人 RAG」架構,解決跨資料庫檢索難題

編輯核心觀點

  • Google Research 推出全新的代理人式 RAG 框架,透過多代理人協作與「充分上下文代理」機制,解決企業搜尋中常見的多步驟查詢失敗問題。
  • 該技術已整合進 Gemini Enterprise Agent Platform 並開放公開預覽,實測顯示在事實準確度上較傳統 RAG 提升達 34%。
  • 系統具備跨資料庫路由能力,能在多個資料來源中精準定位資訊,且在複雜查詢下的延遲增幅控制在 3% 以內。
Google 升級 Gemini 企業級 AI:導入「代理人 RAG」架構,解決跨資料庫檢索難題

解決企業搜尋的「斷鏈」痛點

在企業級應用中,傳統的單步驟檢索增強生成(RAG)技術常面臨瓶頸。例如當使用者詢問「某專案伺服器的規格為何?」時,系統可能僅能找到伺服器 ID,卻無法自動跨越資料庫去查詢該 ID 對應的詳細規格,導致回答不完整或顯示「找不到資訊」。

為了改善此問題,Google Research 團隊在 Gemini Enterprise Agent Platform 中導入了全新的「代理人式 RAG(Agentic RAG)」框架,並推出「跨語料庫檢索(Cross-Corpus Retrieval)」功能。這套系統不再只是單純的搜尋引擎,而是一個具備規劃、推理與迭代能力的「研究團隊」。

多代理人協作架構

Google 的這套框架將任務拆解為多個專業角色,透過協作完成複雜查詢:

  • 協調者(Orchestrator):判斷查詢是否為多步驟任務並進行分派。
  • 規劃代理(Planner Agent):規劃跨資料來源的資訊路徑。
  • 查詢重寫代理(Query Rewriter):將模糊請求轉化為精確的搜尋指令。
  • 搜尋分流代理(Search Fanout Agent):將指令發送至不同資料庫。
  • 合成代理(Synthesis Agent):將收集到的上下文整合成最終回答。

關鍵突破:充分上下文代理

這套框架與其他多代理人架構最大的區別,在於引入了「充分上下文代理(Sufficient Context Agent)」。該組件會在生成回答前,檢查已檢索到的片段是否足以回答問題。若發現資訊缺失,它不會盲目猜測,而是會撰寫一份「缺失分析報告」,指示系統進行二次搜尋。

「充分上下文代理會閱讀從資料庫提取的片段,審核中間草稿,並執行缺失分析。它不只是標記『上下文不足』,還會寫下具體的理由與反饋日誌,指出資訊缺口。」

實測數據與應用場景

Google 團隊使用 FramesQA 基準測試進行評估,該測試包含 824 個查詢與 2,676 份 PDF 文件。在跨語料庫(Cross-corpus)的環境下,該系統成功回答了 90.1% 的問題,且在處理複雜查詢時,系統延遲與單一語料庫查詢相比,平均僅增加不到 3%。

這項技術特別適合需要整合多方資料的企業場景,例如醫療團隊整合病患的用藥、飲食與過敏紀錄;工程團隊追蹤伺服器 ID 與規格;或是財務部門將預算數據與專案時程紀錄進行關聯分析。目前該功能已於 Gemini Enterprise Agent Platform 中開放公開預覽。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章