返回首頁

Perplexity 大升級!Deep Research 導入「程式碼驅動搜尋」,串聯 20 款 AI 模型自動產出報表

編輯核心觀點

  • Perplexity 將深度研究功能整合進 Computer 系統,透過多模型協作與程式碼驅動搜尋,大幅提升分析深度與準確度。
  • 系統能自動規劃研究路徑,並將複雜問題拆解為子任務,分派給超過 20 款前沿模型執行。
  • 除了網頁資訊,該功能支援讀取使用者上傳的 PDF 或試算表,並能直接產出簡報、儀表板與即時更新的試算表。
Perplexity 大升級!Deep Research 導入「程式碼驅動搜尋」,串聯 20 款 AI 模型自動產出報表

從單一搜尋到自動化研究:Perplexity Computer 的進化

Perplexity 近期宣布將其「深度研究(Deep Research)」功能正式整合至 2025 年 2 月底推出的雲端協作系統「Computer」中。這項升級的核心在於多模型協作架構,系統不再依賴單一模型,而是透過「程式碼驅動搜尋(Search as Code)」技術,將複雜的提問自動拆解為多項子任務,並分派給超過 20 款前沿模型進行處理,以 Opus 4.6 作為核心推理引擎。

「程式碼驅動搜尋」如何運作?

與傳統固定式的搜尋流程不同,Perplexity 的新系統會根據使用者的問題自動撰寫搜尋程式碼。該程式碼會在沙盒環境中運行,並呼叫「代理搜尋軟體開發套件(Agent Search SDK)」,執行數千次並行的檢索步驟。系統具備過濾、去重與重新排序等能力,能根據學習到的資訊即時分支、比較並精煉搜尋結果。

效能實測:代理瀏覽能力大幅躍升

根據 Perplexity 公布的內部基準測試數據,Deep Research 在 Computer 系統下的表現顯著優於舊版,尤其在需要瀏覽大量頁面的任務中表現突出:

在 BrowseComp 測試中,系統的準確度從 40.7% 提升至 83.8%;在 Humanity’s Last Exam 測試中,準確度則從 36.4% 提升至 50.5%。

應用場景與開發者支援

該功能目前已開放 Perplexity Max 用戶使用,並提供多種預設任務模組,包括:

  • 金融分析:比較主要 AI 晶片公司過去五年的現金流與利潤率。
  • 法律研究:將美國與歐洲的數據隱私法規差異整理為比較表。
  • 醫療研究:綜合臨床試驗證據,評估減肥藥物對心臟健康的影響。
  • 技術評測:針對主流模型的推理能力、成本與上下文長度進行基準測試。

開發者同樣能透過「代理 API(Agent API)」存取此技術堆疊。系統不僅能讀取即時網頁資訊,還能整合使用者上傳的 PDF 或試算表檔案,並交叉比對 PitchBook、CB Insights 等專業數據源。產出結果可直接轉換為簡報、報告或即時更新的試算表,且系統會在執行變更前提供預覽供使用者確認。

限制與注意事項

儘管功能強大,Perplexity 指出目前的基準測試數據均為內部評估,仍需外部驗證。此外,Deep Research 功能目前僅限於 Max 付費方案,部分專業數據源(如法律數據)仍處於預覽階段。由於 AI 產出的內容仍可能出現錯誤,即便系統提供引用來源,最終產出仍需經過人工審核。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章