以即時注入保護保護企業生成式 AI 應用

即時注入攻擊對生成式 AI 應用構成重大風險。 惡意行為者會設計惡意輸入,使大型語言模型(LLM)忽略指令、洩露敏感資料、執行非預期行為或產生有害內容。

AI Gateway 是 Microsoft Security Service Edge (SSE) 解決方案的一部分,保護生成式 AI 應用程式、代理程式及語言模型。 提示注入保護功能提供即時防護,防範惡意提示注入攻擊,這是大型語言模型(LLM)面臨的重大風險。 透過在網路層級執行防護措施,提示注入保護確保所有生成式 AI 應用的安全一致性,無需修改程式碼。

及時注射保護:

  • 在敵對性提示和越獄嘗試到達 AI 模型之前,會阻擋它們。
  • 防止未經授權的行動及敏感資料外洩。
  • 適用於任何裝置、瀏覽器或應用程式,實現統一執法。

高階架構

圖示,展示具有全球安全存取和 Microsoft Purview 的網路內容過濾架構。

先決條件

若要完成此程序中的步驟,請先準備好下列先決條件:

初始設定

要為您的組織設定提示注入保護,請完成以下步驟:

  1. 啟用網際網路存取流量轉發設定檔 並設定適當的使用者指派。
  2. 配置 傳輸層安全(TLS)檢查設定TLS 檢查政策
  3. 在使用者裝置上安裝並設定全域安全存取用戶端。 請依照在 Microsoft Windows 上安裝全球安全存取用戶端的步驟。

    這很重要

    在繼續之前,請測試並確保客戶的網路流量是經過全球安全存取服務的。

建立新的策略來篩選命令

要建立新的提示注入保護策略:

  1. 請以Global Secure Access Administrator身份登入Microsoft Entra 系統管理中心
  2. 瀏覽至 全球安全存取>安全>提示策略
  3. 選擇 建立政策
  4. 「基礎」標籤頁中,輸入政策的名稱說明
  5. 選取 下一步
  6. 規則 標籤中,選擇 新增規則
  7. 提示規則 頁面:
    1. 輸入或選擇 規則名稱描述優先順序狀態
    2. 動作為封鎖 以阻擋惡意提示。 提示規則畫面的截圖,表單欄位中附有範例數值。
  8. 選擇 + 對話方案 ,為您的企業生成式 AI 選擇目標大型語言模型。
  9. 類型 選單中,選擇與你應用程式相符的語言模型。
  10. 如果語言模型不在清單上:
    1. 選取自訂
    2. 輸入提示傳送服務端點的 網址
    3. 在請求主體中輸入提示詞位置的 JSON 路徑
  11. 選擇 新增 以新增對話方案。 你可以加入多種方案。
  12. 選取 下一步
  13. 要建立提示性政策,請選擇 「建立」。

建立提示注入保護提示政策後,將其連結到新的或現有的安全設定檔。

  1. 流覽至 全域安全存取>安全>安全性設定檔
  2. 選擇或建立你想要將提示政策連結到的安全設定檔。
  3. 選擇 連結政策 標籤。
  4. 選擇 + 連結一個政策>既有的提示政策
  5. 選擇你之前建立的提示注入保護提示政策。
  6. 要將提示注入保護政策連結起來,請選擇 新增

建立條件式存取原則

要建立條件存取政策:

  1. 請以至少 條件存取管理員 身分登入 Microsoft Entra 系統管理中心
  2. 瀏覽至 Entra ID>Conditional Access
  3. 選擇建立新政策
  4. 輸入您的政策名稱。
  5. 選擇 使用者 以指定該政策適用的使用者或群組。
  6. 目標資源 設為 所有具有全球安全存取的網際網路資源
  7. 依需要設定 網路條件授權 設定。
  8. 對於 會話,選擇 使用全域安全存取安全設定檔 ,並選擇你之前建立的安全設定檔。
  9. 選擇 建立 以建立條件存取政策。

欲了解更多資訊,請參閱 針對全球安全存取網際網路流量的條件式存取政策

生成式 AI 模型

以下章節列出更多關於與提示注入保護(Prompt Injection Protection)合作的 AI 模型細節。

支援度最高的生成式 AI 模型

提示注入保護已預先配置具有針對以下模型所設計的客製化擷取器:ChatGPT、Claude、Cohere、Deepseek、Gemini、Grok、Meta AI、Mistral、Perplexity、Pi 和 Qwen。

自訂模型支援

你可以透過設定一個帶有 URL 和 JSON 路徑的自訂型別模型來保護任何自訂的 JSON 型態 LLM 或生成式人工智慧應用程式。

速率上限

  • 系統在掃描指定對話方案的請求時,會套用速率限制。
  • 當系統達到速率上限時,會封鎖後續的請求。
  • 為了優化自訂 LLM 的效能,請為每個方案指定精確的 URL 和 JSON 路徑。

已知的限制

  • 提示注入保護目前僅支援文字提示。 它不支援檔案。
  • 提示注入保護僅支援基於 JSON 的生成式 AI 應用程式。
  • 提示注入防護最多可支援 64,000 個字元的提示。 超過的就會被截斷。