返回首頁

Perplexity AI 發表混合式推理調度器:AI 任務自動分流,兼顧隱私與算力效率

編輯核心觀點

  • Perplexity AI 於 Computex 2026 推出首款混合式本地與伺服器推理調度器,能自動判斷 AI 任務應在裝置端或雲端執行。
  • 透過輕量級本地模型作為路由器,系統可根據資料敏感度與算力需求,即時決定任務處理位置,無需使用者手動介入。
  • 該功能預計於 2026 年 7 月正式導入 Perplexity Computer,支援 Intel Core Ultra Series 3 與 NVIDIA RTX Spark 等硬體平台。
Perplexity AI 發表混合式推理調度器:AI 任務自動分流,兼顧隱私與算力效率

自動化任務分流:AI 運算的隱私與效率平衡

Perplexity AI 在 2026 年台北國際電腦展(Computex 2026)上,發表了一項被稱為「混合式本地伺服器推理調度器(Hybrid Local-Server Inference Orchestrator)」的新技術。這項設計旨在解決目前 AI 系統在準確性、隱私保護與運算成本之間的三重矛盾:追求高準確度往往需要昂貴的頂尖模型,而隱私要求則限制了資料傳輸,同時還需考量運算資源的能源效率。

這套系統的核心在於「混合代理推理(Hybrid Agentic Inference)」。系統會在使用者裝置上運行一個精簡的本地 AI 模型,負責評估每一項傳入的任務或子任務。該模型會自動判斷任務是否涉及敏感資料、是否需要強大算力,或是能否完全在本地端完成。根據評估結果,系統會自動決定將工作留在本地處理,或發送至雲端的頂尖模型。

解決企業級資料治理難題

Perplexity 強調,這項設計直接回應了企業對於代理式 AI 的核心顧慮——資料治理。透過這套調度機制,系統能識別如財務紀錄、健康資訊或個人檔案等敏感資料,並確保其留在裝置端。若任務必須發送至雲端,系統也會預先請求使用者授權,讓資料流向與控制權更加透明。

該系統設計旨在讓本地模型判斷「何時應將敏感資料保留在本地」,並在將敏感任務發送至雲端前,預先徵求使用者的許可。

Perplexity Computer 是該公司於 2026 年 2 月推出的雲端多模型代理產品,而「Personal Computer」則是其延伸,將功能帶入本地裝置,支援存取本地檔案、原生 Mac 應用程式與網頁。此次發表的混合調度器,將進一步優化 Personal Computer 的運作邏輯,使其不再僅是「本地存取檔案、雲端執行運算」的固定模式,而是能根據任務需求,動態決定處理位置。

硬體支援與部署時程

這項調度框架標榜模型中立(model-agnostic)與晶片中立(chip-agnostic),目前已確認可在 Intel Core Ultra Series 3 與 NVIDIA RTX Spark 硬體上運行。該功能預計於 2026 年 7 月正式整合至 Perplexity Computer 中,初期將優先支援 Windows 平台。目前 Personal Computer 已在 Mac 上線,Windows 版本則已開放候補名單申請。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章