Aangepaste categorieën (preview)

Artikel
10/30/2024

Met Azure AI Content Safety kunt u uw eigen con tentmodus rationcategorieën maken en beheren voor verbeterde toezicht en filtering die overeenkomen met uw specifieke beleid of use cases.

Typen aanpassingen

Er zijn meerdere manieren om aangepaste categorieën te definiëren en te gebruiken, die in deze sectie gedetailleerd en vergeleken worden.

API	Functionaliteit
Aangepaste categorieën (standaard) API	Gebruik een aanpasbaar machine learning-model om een aangepaste categorie te maken, op te halen, op te vragen en te verwijderen. Of vermeld alle aangepaste categorieën voor verdere aantekeningentaken.
Aangepaste categorieën (snelle) API	Gebruik een LLM (Large Language Model) om snel specifieke inhoudspatronen te leren in opkomende inhoudsincidenten.

Aangepaste categorieën (standaard) API

Met de API aangepaste categorieën (standaard) kunnen klanten categorieën definiëren die specifiek zijn voor hun behoeften, voorbeeldgegevens leveren, een aangepast machine learning-model trainen en gebruiken om nieuwe inhoud te classificeren op basis van de geleerde categorieën.

Dit is de standaardwerkstroom voor aanpassing met machine learning-modellen. Afhankelijk van de kwaliteit van de trainingsgegevens kan het zeer goede prestatieniveaus bereiken, maar het kan enkele uren duren om het model te trainen.

Deze implementatie werkt op tekstinhoud, niet op afbeeldingsinhoud.

Aangepaste categorieën (snelle) API

De API voor aangepaste categorieën (snel) is ontworpen om sneller en flexibeler te zijn dan de standaardmethode. Het is bedoeld om te worden gebruikt voor het identificeren, analyseren, verwijderen en herstellen van cyberincidenten waarbij ongepaste of schadelijke inhoud op onlineplatforms is betrokken.

Een incident kan betrekking hebben op een reeks opkomende inhoudspatronen (tekst, afbeelding of andere modaliteiten) die in strijd zijn met de richtlijnen van de Microsoft-community of het eigen beleid en de verwachtingen van de klant. Deze incidenten moeten snel en nauwkeurig worden opgelost om potentiële problemen met livesites of schade aan gebruikers en community's te voorkomen.

Deze implementatie werkt op tekstinhoud en afbeeldingsinhoud.

Tip

Een manier om opkomende inhoudsincidenten af te handelen, is door bloklijsten te gebruiken, maar dat staat alleen exacte tekstkoppeling toe en geen afbeeldingskoppeling. De API voor aangepaste categorieën (snelle) categorieën biedt de volgende geavanceerde mogelijkheden:

semantische tekst die overeenkomt met het insluiten van zoekopdrachten met een lichtgewicht classificatie
afbeelding die overeenkomt met een lichtgewicht model voor objecttracking en het insluiten van zoekopdrachten.

De aangepaste categorieën van Azure AI Content Safety maken gebruik van een proces met meerdere stappen voor het maken, trainen en gebruiken van aangepaste modellen voor inhoudsclassificatie. Hier volgt een overzicht van de werkstroom:

Stap 1: Definitie en installatie

Wanneer u een aangepaste categorie definieert, moet u de AI leren welk type inhoud u wilt identificeren. Dit omvat het opgeven van een duidelijke categorienaam en een gedetailleerde definitie die de kenmerken van de inhoud inkapselt.

Vervolgens verzamelt u een evenwichtige gegevensset met positieve en (optioneel) negatieve voorbeelden om de AI te helpen de nuances van uw categorie te leren. Deze gegevens moeten representatief zijn voor de verscheidenheid aan inhoud die het model zal tegenkomen in een praktijkscenario.

Stap 2: Modeltraining

Nadat u uw gegevensset hebt voorbereid en categorieën hebt gedefinieerd, traint de Azure AI Content Safety-service een nieuw machine learning-model. Dit model gebruikt uw definities en geüploade gegevensset om gegevensvergroting uit te voeren met behulp van een groot taalmodel. Als gevolg hiervan wordt de trainingsgegevensset groter en van hogere kwaliteit gemaakt. Tijdens de training analyseert het AI-model de gegevens en leert om onderscheid te maken tussen inhoud die overeenkomt met de opgegeven categorie en inhoud die dat niet doet.

Stap 3: Modeldeductie

Na de training moet u het model evalueren om ervoor te zorgen dat het voldoet aan uw nauwkeurigheidsvereisten. Test het model met nieuwe inhoud die het nog niet eerder heeft ontvangen. De evaluatiefase helpt u bij het identificeren van mogelijke aanpassingen die u nodig hebt om het model in een productieomgeving te implementeren.

Stap 4: Modelgebruik

U gebruikt de analyzeCustomCategory-API om tekstinhoud te analyseren en te bepalen of deze overeenkomt met de aangepaste categorie die u hebt gedefinieerd. De service retourneert een Booleaanse waarde die aangeeft of de inhoud overeenkomt met de opgegeven categorie

Beperkingen

Beschikbaarheid van taal

De API's voor aangepaste categorieën ondersteunen alle talen die worden ondersteund door tekstbeheer voor Inhoudsveiligheid. Raadpleeg Taalondersteuning.

Invoerbeperkingen

Aangepaste categorieën (standaard) API
Aangepaste categorieën (snelle) API

Zie de volgende tabel voor de invoerbeperkingen van de aangepaste categorieën (standaard) API:

Object	Beperking
Ondersteunde talen	Alleen in het Engels
Aantal categorieën per gebruiker	3
Aantal versies per categorie	3
Aantal gelijktijdige builds (processen) per categorie	1
Deductiebewerkingen per seconde	5
Aantal voorbeelden in een categorieversie	Positieve steekproeven (vereist): minimaal 50, maximum 5K In totaal (zowel negatieve als positieve steekproeven): 10.000 Er zijn geen dubbele steekproeven toegestaan.
Voorbeeldbestandsgrootte	maximaal 128000 bytes
Lengte van een tekstvoorbeeld	maximaal 125.000 tekens
Lengte van een categoriedefinitie	maximaal 1000 tekens
Lengte van een categorienaam	maximaal 128 tekens
Lengte van een blob-URL	maximaal 500 tekens

Zie de volgende tabel voor de invoerbeperkingen van de aangepaste categorieën (snelle) API:

Object	Beperking
Maximale lengte van een incidentnaam	100 tekens
Maximum aantal tekst-/afbeeldingsvoorbeelden per incident	1000
Maximale grootte van elke steekproef	Tekst: 500 tekens Afbeelding: 4 MB
Maximum aantal tekst- of afbeeldingsincidenten per resource	100
Ondersteunde afbeeldingsindelingen	BMP, GIF, JPEG, PNG, TIF, WEBP

Regionale beschikbaarheid

Als u deze API's wilt gebruiken, moet u uw Azure AI Content Safety-resource maken in een van de ondersteunde regio's. Zie beschikbaarheid van regio's.

Volgende stappen

Volg een handleiding voor het gebruik van de Azure AI Content Safety-API's om aangepaste categorieën te maken.

Delen via