即時注入攻擊對生成式 AI 應用構成重大風險。 惡意行為者會設計惡意輸入,使大型語言模型(LLM)忽略指令、洩露敏感資料、執行非預期行為或產生有害內容。
AI Gateway 是 Microsoft Security Service Edge (SSE) 解決方案的一部分,保護生成式 AI 應用程式、代理程式及語言模型。 提示注入保護功能提供即時防護,防範惡意提示注入攻擊,這是大型語言模型(LLM)面臨的重大風險。 透過在網路層級執行防護措施,提示注入保護確保所有生成式 AI 應用的安全一致性,無需修改程式碼。
及時注射保護:
- 在敵對性提示和越獄嘗試到達 AI 模型之前,會阻擋它們。
- 防止未經授權的行動及敏感資料外洩。
- 適用於任何裝置、瀏覽器或應用程式,實現統一執法。
高階架構
先決條件
若要完成此程序中的步驟,請先準備好下列先決條件:
- 有效的Microsoft Entra 網際網路存取執照。 如有需要,您可以購買授權或取得試用版授權。
- 一個或多個運行 Windows 的裝置或虛擬機器,這些機器是透過 Microsoft Entra 加入或混合加入,連接到你組織的 Microsoft Entra ID。
- 要設定全域安全存取設定,你需要全 域安全存取管理員角色。
- 要設定條件存取政策,你需要條件 存取管理員角色。
初始設定
要為您的組織設定提示注入保護,請完成以下步驟:
- 啟用網際網路存取流量轉發設定檔 並設定適當的使用者指派。
- 配置 傳輸層安全(TLS)檢查設定 與 TLS 檢查政策。
- 在使用者裝置上安裝並設定全域安全存取用戶端。 請依照在 Microsoft Windows 上安裝全球安全存取用戶端的步驟。
這很重要
在繼續之前,請測試並確保客戶的網路流量是經過全球安全存取服務的。
建立新的策略來篩選命令
要建立新的提示注入保護策略:
- 請以Global Secure Access Administrator身份登入Microsoft Entra 系統管理中心。
- 瀏覽至 全球安全存取>安全>提示策略。
- 選擇 建立政策。
- 在「基礎」標籤頁中,輸入政策的名稱和說明。
- 選取 下一步。
- 在 規則 標籤中,選擇 新增規則。
- 在 提示規則 頁面:
- 選擇 + 對話方案 ,為您的企業生成式 AI 選擇目標大型語言模型。
- 從 類型 選單中,選擇與你應用程式相符的語言模型。
- 如果語言模型不在清單上:
- 選取自訂。
- 輸入提示傳送服務端點的 網址 。
- 在請求主體中輸入提示詞位置的 JSON 路徑 。
- 選擇 新增 以新增對話方案。 你可以加入多種方案。
- 選取 下一步。
- 要建立提示性政策,請選擇 「建立」。
將提示政策連結到你的安全設定檔
建立提示注入保護提示政策後,將其連結到新的或現有的安全設定檔。
- 流覽至 全域安全存取>安全>安全性設定檔。
- 選擇或建立你想要將提示政策連結到的安全設定檔。
- 選擇 連結政策 標籤。
- 選擇 + 連結一個政策>既有的提示政策。
- 選擇你之前建立的提示注入保護提示政策。
- 要將提示注入保護政策連結起來,請選擇 新增。
建立條件式存取原則
要建立條件存取政策:
- 請以至少 條件存取管理員 身分登入 Microsoft Entra 系統管理中心。
- 瀏覽至 Entra ID>Conditional Access。
- 選擇建立新政策。
- 輸入您的政策名稱。
- 選擇 使用者 以指定該政策適用的使用者或群組。
- 將 目標資源 設為 所有具有全球安全存取的網際網路資源。
- 依需要設定 網路、 條件和 授權 設定。
- 對於 會話,選擇 使用全域安全存取安全設定檔 ,並選擇你之前建立的安全設定檔。
- 選擇 建立 以建立條件存取政策。
欲了解更多資訊,請參閱 針對全球安全存取網際網路流量的條件式存取政策。
生成式 AI 模型
以下章節列出更多關於與提示注入保護(Prompt Injection Protection)合作的 AI 模型細節。
支援度最高的生成式 AI 模型
提示注入保護已預先配置具有針對以下模型所設計的客製化擷取器:ChatGPT、Claude、Cohere、Deepseek、Gemini、Grok、Meta AI、Mistral、Perplexity、Pi 和 Qwen。
自訂模型支援
你可以透過設定一個帶有 URL 和 JSON 路徑的自訂型別模型來保護任何自訂的 JSON 型態 LLM 或生成式人工智慧應用程式。
速率上限
- 系統在掃描指定對話方案的請求時,會套用速率限制。
- 當系統達到速率上限時,會封鎖後續的請求。
- 為了優化自訂 LLM 的效能,請為每個方案指定精確的 URL 和 JSON 路徑。
已知的限制
- 提示注入保護目前僅支援文字提示。 它不支援檔案。
- 提示注入保護僅支援基於 JSON 的生成式 AI 應用程式。
- 提示注入防護最多可支援 64,000 個字元的提示。 超過的就會被截斷。