自訂類別 (預覽)
Azure AI 內容安全可讓您建立及管理自己的內容審核類別,以取得符合特定原則或使用案例的增強審核和篩選。
自訂的選項
有多種方式可定義及使用自訂類別,本節會詳細說明及比較這些類別。
API | 功能 |
---|---|
自訂類別 (標準) API | 使用可自訂的機器學習模型來建立、取得、查詢和刪除自訂類別。 或者,列出全部自訂類別,以取得進一步的註釋工作。 |
自訂類別 (快速) API | 使用大型語言模型 (LLM) 快速瞭解新興內容事件中的特定內容模式。 |
自訂類別 (標準) API
自訂分類 (標準) API 可讓客戶定義其需求特定的分類、提供範例資料、定型自訂機器學習模型,以及使用它根據學習的類別分類新內容。
這是使用機器學習模型進行自訂的標準工作流程。 視定型資料品質而定,它可以達到非常好的效能等級,但最多可能需要數小時才能定型模型。
此實作適用於文字內容,而非影像內容。
自訂類別 (快速) API
自訂類別 (快速) API 的設計目的是比標準方法更快且更有彈性。 這能夠用於識別、分析、包含、消除和復原涉及在線平台上不當或有害內容的網路事件。
事件可能涉及一組新興的內容模式 (文字、影像或其他形式),違反 Microsoft 社群指導方針或客戶自己的原則和期望。 這些事件需要快速且準確地緩解,以避免潛在的即時網站問題或對使用者和社群造成傷害。
此實作適用於文字內容和影像內容。
提示
處理新興內容事件的其中一種方法是使用封鎖清單,但只允許確切的文字比對,而且沒有影像比對。 自訂類別 (快速) API 提供下列進階功能:
- 使用內嵌搜尋搭配輕量分類器的語意文字比對
- 影像比對與輕量型物件追蹤模型和內嵌搜尋。
運作方式
Azure AI 內容安全自訂類別功能會使用多步驟流程來建立、定型及使用自訂內容分類模型。 以下就來看看此工作流程:
步驟 1:定義和設定
您定義自訂類別時,您必須教導 AI 您想要識別的內容類型。 這牽涉到提供清楚類別名稱,以及封裝內容特性的詳細定義。
然後,您會收集正和 (選用) 負範例的平衡資料集,以協助 AI 瞭解類別的細微差別。 此資料應該代表模型在真實案例中會遇到的各種內容。
步驟 2:模型定型
準備資料集並定義類別之後,Azure AI 內容安全服務會訓練新的機器學習模型。 此模型會使用您的定義和上傳的資料集,以使用大型語言模型執行資料擴充。 因此,定型資料集會更大且品質較高。 在定型期間,AI 模型會分析資料,並學習區分與指定的類別和內容不相符的內容。
步驟 3:模型推斷
定型之後,您必須評估模型,以確保其符合您的正確性需求。 使用之前尚未收到的新內容來測試模型。 評估階段可協助您識別將模型部署至生產環境所需的任何潛在調整。
步驟 4:模型使用方式
您可以使用 analyzeCustomCategory 分析文字內容,並判斷它是否符合您定義的自訂類別。 服務會傳回布林值,指出內容是否與指定的類別對齊
限制
語言可用性
自訂類別 API 支援內容安全文字審核支援的全部語言。 請參閱語言支援。
輸入限制
如需自訂類別 (標準) API 的輸入限制,請參閱下表:
Object | 限制 |
---|---|
支援的語言 | 僅英文 |
每位使用者的類別數目 | 3 |
每個類別的版本數目 | 3 |
每個類別的並行組建數目 (程序) | 1 |
每秒的推斷作業 | 5 |
類別版本中的範例數目 | 正範例 (必要):最低 50,最大 5K 總計 (負範例和正範例):10K 不允許重複的範例。 |
範例檔案大小 | 最多 128000 位元組 |
文字範例的長度 | 最多 125K 個字元 |
類別定義的長度 | 最多 1000 個字元 |
類別名稱的長度 | 最多 128 個字元 |
Blob URL 的長度 | 最多 500 個字元 |