如何使用 Azure OpenAI 服務設定內容篩選
注意
所有客戶都能夠修改內容篩選,並設定嚴重性閾值(低、中、高)。 需要核准才能部分或完全關閉內容篩選。 受控客戶只能透過此窗體申請完整的內容篩選控件: Azure OpenAI 有限存取權檢閱:修改的內容篩選。
整合至 Azure OpenAI 服務的內容篩選系統會與核心模型一起執行,並使用多類別分類模型的合奏,在四個嚴重性層級分別偵測四種有害內容(暴力、仇恨、性及自我傷害)(安全、低、中和高),以及選擇性二進位分類器,以偵測公用存放庫中的越獄風險、現有文字和程序代碼。 默認內容篩選組態會設定為針對提示和完成的四個內容危害類別,在中等嚴重性臨界值上進行篩選。 這表示在嚴重性層級中或高層級偵測到的內容會經過篩選,而在嚴重性層級低或安全偵測到的內容,則內容篩選不會篩選。 在這裡深入瞭解內容類別、嚴重性層級和內容篩選系統的行為。 越獄風險偵測和受保護的文字和程式代碼模型預設為選擇性和關閉。 針對越獄和受保護的材料文字和程序代碼模型,可設定功能可讓所有客戶開啟和關閉模型。 模型預設為關閉,而且每個案例都可以開啟。 某些案例必須開啟某些模型,才能保留客戶著作權承諾下的涵蓋範圍。
內容篩選可以在資源層級設定。 建立新的組態之後,即可與一或多個部署建立關聯。 如需模型部署的詳細資訊,請參閱資源部署指南。
這項可設定功能可在預覽中取得,並可讓客戶針對提示和完成個別調整設定,以篩選不同嚴重性層級上每個內容類別的內容,如下表所述。 在「安全」嚴重性層級偵測到的內容會標示為批註,但不受限於篩選,且無法設定。
篩選的嚴重性 | 可針對提示設定 | 可針對完成設定 | Description |
---|---|---|---|
低、中等、高 | Yes | Yes | 最嚴格的篩選設定。 篩選在嚴重性層級低、中和高時偵測到的內容。 |
中、高 | Yes | Yes | 預設設定。 偵測到嚴重性層級為低的內容不會被篩選,中和高的內容將被篩選。 |
高 | Yes | Yes | 偵測到嚴重性層級為低和中的內容不會被篩選。 僅篩選嚴重性層級為高的內容。 |
沒有篩選 | 如果核准* | 如果核准* | 無論偵測到的嚴重性層級如何,都不會篩選任何內容。 需要核准*。 |
* 只有已核准的客戶具有完整的內容篩選控件,而且可以部分或完全關閉內容篩選。 受控客戶只能透過此窗體申請完整的內容篩選控件: Azure OpenAI 有限存取權檢閱:修改的內容篩選
客戶須負責確保整合 Azure OpenAI 的應用程式符合 規範。
篩選類別 | 預設設定 | 套用至提示或完成? | 描述 |
---|---|---|---|
越獄風險偵測 | 關閉 | 提示 | 可以開啟以篩選或標註可能會有越獄風險的使用者提示。 如需取用批注的詳細資訊,請流覽 Azure OpenAI 服務內容篩選 |
受保護的數據 - 程序代碼 | 關閉 | Completion | 可以開啟 ,以取得註釋中符合任何公用程式代碼來源之代碼段的範例引文和授權資訊。 如需取用批注的詳細資訊,請參閱 內容篩選概念指南 |
受保護的材質 - 文字 | 關閉 | Completion | 可以開啟 ,以識別並阻止已知的文字內容顯示在模型輸出中(例如歌曲歌詞、食譜和選取的 Web 內容)。 |
透過 Azure OpenAI Studio 設定內容篩選 (預覽)
下列步驟示範如何為您的資源設定自定義內容篩選組態。
移至 Azure OpenAI Studio 並流覽至 [內容篩選] 索引標籤(左下導覽中,如下方紅色方塊所指定)。
建立新的自定義內容篩選組態。
這會導致下列組態檢視,您可以在其中選擇自定義內容篩選組態的名稱。
這是預設內容篩選組態的檢視,其中內容會篩選為所有類別的中高嚴重性層級。 您可以針對使用者提示和模型完成分別修改內容篩選嚴重性層級(提示的組態位於左側數據行,而完成的組態位於右側數據行,如以下的藍色方塊所指定)的四個內容類別中每一個 (內容類別列在畫面左側, 如下方的綠色方塊所指定。 每個類別都有三個可設定的嚴重性層級:低、中和高。 您可以使用滑桿來設定嚴重性閾值。
如果您判斷您的應用程式或使用案例需要更嚴格的部分或所有內容類別篩選,您可以分別設定設定提示和完成,以比預設設定更多的嚴重性層級進行篩選。 下圖顯示一個範例,其中使用者提示的篩選層級會設定為最嚴格的仇恨和性設定,其中篩選的嚴重性內容低,以及分類為中高嚴重性的內容(如下紅色方塊所示)。 在此範例中,模型完成的篩選層級會設定為所有內容類別的最嚴格組態(下方的藍色方塊)。 有了這項修改後的篩選設定,低、中、高嚴重性內容將會在使用者提示中篩選仇恨和性類別:中高嚴重性內容會針對使用者提示中的自我傷害和暴力類別進行篩選;和低、中、高嚴重性內容將會針對模型完成中的所有內容類別進行篩選。
如果您的使用案例已核准修改的內容篩選,如上所述,您會收到內容篩選設定的完整控制權,而且可以選擇部分或完全關閉篩選。 在下圖中,系統會關閉暴力篩選(下方的綠色方塊),而預設組態會保留給其他類別。 雖然這會停用暴力的篩選功能,但內容仍會加上批注。 若要關閉所有篩選和批注,請關閉 [篩選和批注] (下方的紅色方塊)。
您可以根據需求建立多個內容篩選組態。
若要開啟選擇性模型,您可以選取左側的任何複選框。 當每個選擇性模型都開啟時,您可以指出模型是否應該標註或篩選。
選取 [批注] 會執行個別的模型,並透過 API 回應傳回批注,但不會篩選內容。 除了註釋之外,您也可以選擇將 [篩選] 切換為 [開啟] 來篩選內容。
您可以根據需求建立多個內容篩選組態。
接下來,若要讓自定義內容篩選組態運作,請將設定指派給資源中的一或多個部署。 若要這樣做,請移至 [ 部署] 索引 標籤,然後選取 [編輯部署 ] (在下方紅色方塊中以靠近畫面頂端的外框)。
移至進階選項(下方藍色方塊中概述)從 [內容 篩選] 下拉式清單中選取適合該部署的內容篩選組態(在下方紅色方塊的對話框底部外框)。
選取 [ 儲存並關閉 ] 以將選取的組態套用至部署。
如有需要,您也可以編輯和刪除內容篩選組態。 若要這樣做,請流覽至內容篩選索引標籤,然後選取所需的動作(下方紅色方塊中靠近畫面頂端的選項)。 您一次只能編輯/刪除一個篩選組態。
注意
刪除內容篩選組態之前,您必須從 [部署] 索引標籤中的任何部署取消指派。
最佳作法
建議您透過反覆識別來通知內容篩選組態決策(例如,紅色小組測試、壓力測試和分析),以及測量程式,以解決與特定模型、應用程式和部署案例相關的潛在危害。 實作內容篩選等風險降低措施之後,請重複測量以測試有效性。 Azure OpenAI 的負責任 AI 建議 和最佳做法,其基礎是您可以在 Azure OpenAI 的負責任 AI 概觀中找到 Microsoft Responsible AI Standard。
下一步
- 深入瞭解 Azure OpenAI 的負責任 AI 做法: Azure OpenAI 模型的負責任 AI 做法概觀。
- 深入瞭解 Azure OpenAI 服務的內容篩選類別和嚴重性層級 。
- 從我們的 :紅色小組大型語言模型 (LLM) 簡介文章深入瞭解紅色小組。