本文概述了建立與部署可信賴 AI 代理的資源。 這包括端對端安全性、可檢視性和控管,以及代理程式生命週期所有階段的控件和檢查點。 我們建議的基本開發步驟是以 Microsoft 負責任 AI 標準為基礎,其會設定我們自己的工程小組遵循的原則需求。 標準的大部分內容都遵循模式,要求小組探索、保護和治理潛在的內容風險。
在Microsoft中,我們的方法是由根植於 AI 準則的治理架構所引導,該架構會建立產品需求,並作為我們的「北星」。當我們識別產生 AI 的商業使用案例時,我們會先探索並評估 AI 系統的潛在風險,以找出關鍵焦點領域。
一旦我們識別這些風險,我們會透過系統測量來評估 AI 系統中的流行程度,以協助我們優先處理需要注意的領域。 然後,我們會在模型和代理程式層級針對這些風險套用適當的保護。
最後,我們檢視管理生產風險的策略,包括部署及營運準備,並設立監控以支持持續治理,確保合規性,並在應用程式上線後發現新風險。
為了配合Microsoft的 RAI 做法,這些建議會組織成三個階段:
- 探索 部署前後的代理程式品質、安全性和安全性風險。 例如,用對抗性提示測試你的代理,以找出潛在的越獄漏洞。
- 保護 – 在模型輸出和代理程式運行時間層級 – 防範安全性風險、不想要的輸出和不安全的動作。 使用內容過濾器和護欄,在有害輸出到達使用者之前阻擋它們。
- 透過追蹤和監視工具和合規性整合來治理代理程式。 建立持續監控以追蹤代理行為並偵測生產異常。
查看並回應安全警示
您可以在 [ 風險 + 警示 ] 區段中檢視適用於雲端的 Defender 安全性警示和建議,以改善您的安全性狀態。 安全警示是 Defender for Foundry Tools 計畫在 AI 工作負載中識別威脅時所產生的通知。 你可以在 Azure portal 或 Defender 入口網站採取行動處理這些警示。
要查看安全警報:
- 登入 Microsoft Foundry 入口網站。
- 瀏覽至您的專案。
- 在左側導覽中,選擇 風險+警示。
- 檢視現有警示與建議。
- 選擇警示以查看詳細資訊及修復步驟。
- 欲了解更多安全警示,請參閱 Alerts for AI workloads (Preview)。
- 欲了解更多安全建議,請參閱 Review security recommendations。