返回首頁

防堵惡意指令注入:OpenAI 推出「鎖定模式」強化敏感數據防護

編輯核心觀點

  • OpenAI 針對 ChatGPT 推出「鎖定模式」(Lockdown Mode),旨在降低敏感數據因提示詞注入攻擊而外洩的風險。
  • 該模式會關閉即時聯網瀏覽、網路圖片檢索、深度研究與代理人模式,僅允許存取快取內容。
  • 此功能目前正陸續開放給 ChatGPT Business 自助服務帳戶及符合資格的個人帳戶使用。
防堵惡意指令注入:OpenAI 推出「鎖定模式」強化敏感數據防護

OpenAI 近日宣布推出一項名為「鎖定模式」(Lockdown Mode)的新功能,主要目的在於防範「提示詞注入」(prompt injection)攻擊。這類攻擊手法通常將惡意指令隱藏在網頁或其他內容來源中,藉此操縱聊天機器人的行為。

鎖定模式的防護機制

當用戶啟用鎖定模式後,ChatGPT 將會自動停用多項連網與自動化功能,以減少攻擊面。具體限制包括:

  • 關閉即時網頁瀏覽:系統將僅能存取快取內容,無法即時存取外部網站。
  • 限制網路圖片檢索:無法從網頁抓取與顯示圖片(但仍可使用 AI 生成圖片)。
  • 停用深度研究與代理人模式:限制模型執行複雜的自動化任務。

OpenAI 指出,該模式的目標是降低敏感數據在處理過程中外洩的可能性。不過,官方也坦言,即便開啟鎖定模式,ChatGPT 仍無法完全免疫於所有提示詞注入攻擊,例如隱藏在快取網頁內容或上傳檔案中的惡意指令,仍可能影響模型的反應行為或準確性。

適用對象與定位

針對此功能的定位,OpenAI 明確表示:

鎖定模式並非為所有用戶設計,它是專為處理敏感數據,且希望針對提示詞注入導致的數據外洩風險,採取更嚴格防護措施的個人與組織所開發。

目前,OpenAI 已開始將此功能推廣至 ChatGPT Business 自助服務帳戶,以及部分符合資格的個人帳戶中。

資料來源

本文由 AI 綜合上述來源編譯整理,內容僅供參考;著作權歸原出處所有。

相關文章