Udostępnij za pośrednictwem


Kategorie niestandardowe (wersja zapoznawcza)

Bezpieczeństwo zawartości usługi Azure AI umożliwia tworzenie własnych kategorii kon tryb namiotu ration i zarządzanie nimi na potrzeby rozszerzonego moderowania i filtrowania, które są zgodne z określonymi zasadami lub przypadkami użycia.

Typy dostosowywania

Istnieje wiele sposobów definiowania i używania kategorii niestandardowych, które są szczegółowe i porównywane w tej sekcji.

interfejs API Funkcje
Interfejs API kategorii niestandardowych (standardowy) Użyj dostosowywalnego modelu uczenia maszynowego, aby utworzyć, pobrać, wysłać zapytanie i usunąć dostosowaną kategorię. Możesz też wyświetlić listę wszystkich niestandardowych kategorii dla dalszych zadań adnotacji.
Interfejs API kategorii niestandardowych (szybki) Użyj dużego modelu językowego (LLM), aby szybko nauczyć się określonych wzorców zawartości w pojawiających się zdarzeniach dotyczących zawartości.

Interfejs API kategorii niestandardowych (standardowy)

Interfejs API kategorii niestandardowych (standardowy) umożliwia klientom definiowanie kategorii specyficznych dla ich potrzeb, dostarczanie przykładowych danych, trenowanie niestandardowego modelu uczenia maszynowego i używanie go do klasyfikowania nowej zawartości zgodnie ze poznanymi kategoriami.

Jest to standardowy przepływ pracy do dostosowywania za pomocą modeli uczenia maszynowego. W zależności od jakości danych treningowych może osiągnąć bardzo dobre poziomy wydajności, ale trenowanie modelu może potrwać do kilku godzin.

Ta implementacja działa na zawartości tekstowej, a nie na zawartości obrazu.

Interfejs API kategorii niestandardowych (szybki)

Interfejs API kategorii niestandardowych (szybki) został zaprojektowany tak, aby był szybszy i bardziej elastyczny niż metoda standardowa. Służy do identyfikowania, analizowania, zawierania, eliminowania i odzyskiwania po incydentach cybernetycznych, które obejmują nieodpowiednią lub szkodliwą zawartość na platformach internetowych.

Zdarzenie może obejmować zestaw pojawiających się wzorców zawartości (tekst, obraz lub inne modalności), które naruszają wytyczne społeczności firmy Microsoft lub własne zasady i oczekiwania klientów. Te zdarzenia należy szybko i dokładnie ograniczyć, aby uniknąć potencjalnych problemów z witrynami na żywo lub zaszkodzić użytkownikom i społecznościom.

Ta implementacja działa na zawartości tekstowej i zawartości obrazu.

Napiwek

Jednym ze sposobów radzenia sobie z pojawiającymi się zdarzeniami zawartości jest użycie listy zablokowanych, ale pozwala to na dokładne dopasowywanie tekstu i brak dopasowania obrazu. Interfejs API kategorii niestandardowych (szybki) oferuje następujące zaawansowane funkcje:

  • dopasowywanie tekstu semantycznego przy użyciu wyszukiwania osadzania z uproszczonym klasyfikatorem
  • dopasowywanie obrazu z uproszczonym modelem śledzenia obiektów i osadzaniem wyszukiwania.

Jak to działa

Funkcja kategorii niestandardowych Bezpieczeństwo zawartości usługi Azure AI używa wieloetapowego procesu tworzenia, trenowania i używania niestandardowych modeli klasyfikacji zawartości. Oto spojrzenie na przepływ pracy:

Krok 1. Definicja i konfiguracja

Podczas definiowania kategorii niestandardowej musisz nauczyć sztuczną inteligencję, jakiego typu zawartości chcesz zidentyfikować. Obejmuje to podanie jasnej nazwy kategorii i szczegółowej definicji , która hermetyzuje cechy zawartości.

Następnie zbierz zrównoważony zestaw danych z pozytywnymi i (opcjonalnie) negatywnymi przykładami, aby ułatwić sztucznej inteligencji poznanie niuansów kategorii. Te dane powinny być reprezentatywne dla różnych treści, które model napotka w rzeczywistym scenariuszu.

Krok 2. Trenowanie modelu

Po przygotowaniu zestawu danych i zdefiniowaniu kategorii usługa Azure AI Content Safety service szkoli nowy model uczenia maszynowego. Ten model używa definicji i przekazanego zestawu danych do wykonywania rozszerzania danych przy użyciu dużego modelu językowego. W rezultacie zestaw danych trenowania jest większy i o wyższej jakości. Podczas trenowania model sztucznej inteligencji analizuje dane i uczy się rozróżniać zawartość zgodną z określoną kategorią i zawartością, która nie jest.

Krok 3. Wnioskowanie modelu

Po trenowaniu należy ocenić model, aby upewnić się, że spełnia wymagania dotyczące dokładności. Przetestuj model przy użyciu nowej zawartości, która nie została wcześniej odebrana. Faza oceny ułatwia zidentyfikowanie wszelkich potencjalnych korekt, które należy wprowadzić w środowisku produkcyjnym.

Krok 4. Użycie modelu

Interfejs API analyzeCustomCategory służy do analizowania zawartości tekstowej i określania, czy jest ona zgodna z zdefiniowaną kategorią niestandardową. Usługa zwróci wartość logiczną wskazującą, czy zawartość jest zgodna z określoną kategorią

Ograniczenia

Dostępność języków

Interfejsy API kategorii niestandardowych obsługują wszystkie języki obsługiwane przez moderowanie tekstu Bezpieczeństwo zawartości. Zobacz Obsługa języków.

Ograniczenia danych wejściowych

W poniższej tabeli przedstawiono ograniczenia danych wejściowych interfejsu API kategorii niestandardowych (standard):

Objekt Ograniczenie
Obsługiwane języki Tylko w języku angielskim
Liczba kategorii na użytkownika 3
Liczba wersji na kategorię 3
Liczba współbieżnych kompilacji (procesów) na kategorię 1
Operacje wnioskowania na sekundę 5
Liczba próbek w wersji kategorii Próbki dodatnie (wymagane): minimalna 50, maksymalna 5K
W sumie (zarówno próbki ujemne, jak i dodatnie): 10 000
Nie są dozwolone zduplikowane próbki.
Rozmiar pliku przykładowego maksymalnie 128000 bajtów
Długość przykładu tekstowego maksymalnie 125 tys. znaków
Długość definicji kategorii maksymalnie 1000 znaków
Długość nazwy kategorii maksymalnie 128 znaków
Długość adresu URL obiektu blob maksymalnie 500 znaków