顛覆傳統搜尋!Perplexity「程式碼即搜尋」讓 AI 自訂檢索管線,精準度與效率大躍進
編輯核心觀點
- ✦Perplexity 推出「程式碼即搜尋」(Search as Code, SaC)架構,讓 AI 模型能以 Python 程式碼自訂搜尋流程,取代傳統固定 API。
- ✦此創新模式能大幅提升搜尋結果的精準度,並顯著降低大型語言模型的 Token 使用量,解決現有 AI 代理程式的檢索瓶頸。
- ✦實際測試顯示,SaC 在複雜的資安漏洞研究任務中,不僅能有效完成任務,Token 消耗更減少 85%,超越傳統與競爭對手。

過去,人工智慧(AI)代理程式在執行複雜的資料研究任務時,往往受限於既有的搜尋模式:模型發出查詢、搜尋 API 回傳結果列表、模型閱讀後再發出下一輪查詢,如此反覆循環。Perplexity 指出,這種為人類設計的「藍色連結」式搜尋引擎,對需要短時間內執行數百次搜尋的 AI 而言,過於僵化且效率不彰,形成嚴重的瓶頸。
為了解決這個痛點,AI 搜尋引擎新創 Perplexity 近期推出劃時代的「程式碼即搜尋」(Search as Code, SaC)架構。這項技術不再讓 AI 模型呼叫固定的搜尋 API,而是賦予模型自行編寫 Python 程式碼,以客製化搜尋流程的能力,承諾帶來更精準的結果與更低的 Token 使用量。
AI 自主編寫搜尋腳本,擺脫傳統 API 限制
「程式碼即搜尋」的核心概念,在於將傳統搜尋引擎的黑箱操作轉化為可程式化的模組。AI 模型不再僅能調整搜尋詞彙,而是能即時建構一套客製化的搜尋管線。這套管線利用基本的搜尋原語(search primitives),如擷取、篩選、去重複與重新排序等,這些功能都被包裝成簡單易用的 SDK 函數。
運作上,SaC 架構分為三個層次:最上層是負責理解任務並制定搜尋策略的 AI 模型;中間層是執行程式碼的安全沙盒(secure sandbox);最底層則是「代理式搜尋軟體開發套件」(Agentic Search SDK),它將 Perplexity 的搜尋引擎拆解成獨立且可任意組合的功能組件,供模型調用。
Perplexity 強調,這項創新最大的優勢在於能顯著提升搜尋效率與精準度。傳統搜尋管線常將大量無關資訊塞入 AI 代理程式的上下文視窗(context window),導致模型「迷失方向」。但透過 SaC,AI 模型能自行編寫過濾邏輯,程式化地排除雜訊,只將真正相關的資訊拉入上下文,確保模型在長時間的研究過程中保持清晰的判斷力,並大幅減少 Token 消耗。
雖然標準搜尋 API 仍適用於簡單的快速查詢,但對於複雜的研究任務,模型能透過 SaC 進行更深度的探索,例如同時發出多個平行查詢,或是根據特定條件進行精細篩選。
資安漏洞研究實測:Token 消耗銳減 85%,表現超越競爭者
為驗證 SaC 在實際應用中的成效,Perplexity 進行了一項複雜的網路安全任務測試。代理程式需追蹤 2023 年至 2025 年間發布的 200 個關鍵軟體漏洞(CVE),並為每個漏洞找出官方供應商的建議、受影響的軟體以及修補錯誤的確切版本,且新聞報導或部落格文章不列入計算。
透過 SaC,AI 模型編寫了一個三階段的腳本:首先,它針對 Mozilla 或 Google 等特定供應商的安全公告格式,執行量身打造的平行搜尋;接著,模型掃描自己的搜尋結果,找出遺漏之處,並執行有針對性的後續查詢;最後,它利用預設的資料架構(schema)來驗證 CVE 資訊、產品與修復版本是否完全吻合。
結果令人驚豔。Perplexity 表示,該代理程式不僅精準完成了任務,Token 使用量更比其標準管線減少了 85%。相較之下,其他競爭系統僅能正確處理不到四分之一的資料。
根據 Perplexity 提供的基準測試數據,SaC 在五項評比中領先四項,僅在「HLE」項目與 OpenAI 的 Responses API 表現不相上下。其中,差距最大的是 Perplexity 自行開發、即將發布的廣泛研究任務基準「WANDR」。當然,對於廠商自行公布的基準測試結果,應抱持審慎態度,但 SaC 相較於 Perplexity 自身舊有架構的性能提升,確實展現了顯著的飛躍。
程式碼成為 AI 代理程式與世界互動的新操作層
Perplexity 將 SaC 視為 AI 發展的一大趨勢。傳統軟體依賴確定性指令,而前沿 AI 模型則在 Token 空間中進行推理。最先進的系統將兩者結合:模型負責策略,確定性執行環境處理批次處理和篩選,搜尋基礎設施則作為輸入/輸出層。這項技術的推出,也呼應了另一份研究報告的觀點——編寫程式碼正成為 AI 代理程式與世界互動的預設方式,程式碼儼然成為代理程式新的操作層(operational layer)。
這項升級有望解決當前 AI 搜尋中一個顯而易見的問題。近期一項研究發現,許多流行的搜尋代理程式在 BrowseComp 等基準測試中存在「作弊」行為:它們並非掃描即時網路,而是直接從訓練資料中提取答案,再利用搜尋來確認已知資訊。當面對包含全新事實的基準測試時,所有系統的得分都驟降了 25 到 40 個百分點。然而,這些系統都依賴標準搜尋工具,這凸顯了 SaC 這種客製化、深度搜尋能力的重要性。
目前,「程式碼即搜尋」功能已在 Perplexity Computer 和 Agent API 中陸續推出。



