Aangepaste categorieën (preview)
Met Azure AI Content Safety kunt u uw eigen con tentmodus rationcategorieën maken en beheren voor verbeterde toezicht en filtering die overeenkomen met uw specifieke beleid of use cases.
Typen aanpassingen
Er zijn meerdere manieren om aangepaste categorieën te definiëren en te gebruiken, die in deze sectie gedetailleerd en vergeleken worden.
API | Functionaliteit |
---|---|
Aangepaste categorieën (standaard) API | Gebruik een aanpasbaar machine learning-model om een aangepaste categorie te maken, op te halen, op te vragen en te verwijderen. Of vermeld alle aangepaste categorieën voor verdere aantekeningentaken. |
Aangepaste categorieën (snelle) API | Gebruik een LLM (Large Language Model) om snel specifieke inhoudspatronen te leren in opkomende inhoudsincidenten. |
Aangepaste categorieën (standaard) API
Met de API aangepaste categorieën (standaard) kunnen klanten categorieën definiëren die specifiek zijn voor hun behoeften, voorbeeldgegevens leveren, een aangepast machine learning-model trainen en gebruiken om nieuwe inhoud te classificeren op basis van de geleerde categorieën.
Dit is de standaardwerkstroom voor aanpassing met machine learning-modellen. Afhankelijk van de kwaliteit van de trainingsgegevens kan het zeer goede prestatieniveaus bereiken, maar het kan enkele uren duren om het model te trainen.
Deze implementatie werkt op tekstinhoud, niet op afbeeldingsinhoud.
Aangepaste categorieën (snelle) API
De API voor aangepaste categorieën (snel) is ontworpen om sneller en flexibeler te zijn dan de standaardmethode. Het is bedoeld om te worden gebruikt voor het identificeren, analyseren, verwijderen en herstellen van cyberincidenten waarbij ongepaste of schadelijke inhoud op onlineplatforms is betrokken.
Een incident kan betrekking hebben op een reeks opkomende inhoudspatronen (tekst, afbeelding of andere modaliteiten) die in strijd zijn met de richtlijnen van de Microsoft-community of het eigen beleid en de verwachtingen van de klant. Deze incidenten moeten snel en nauwkeurig worden opgelost om potentiële problemen met livesites of schade aan gebruikers en community's te voorkomen.
Deze implementatie werkt op tekstinhoud en afbeeldingsinhoud.
Tip
Een manier om opkomende inhoudsincidenten af te handelen, is door bloklijsten te gebruiken, maar dat staat alleen exacte tekstkoppeling toe en geen afbeeldingskoppeling. De API voor aangepaste categorieën (snelle) categorieën biedt de volgende geavanceerde mogelijkheden:
- semantische tekst die overeenkomt met het insluiten van zoekopdrachten met een lichtgewicht classificatie
- afbeelding die overeenkomt met een lichtgewicht model voor objecttracking en het insluiten van zoekopdrachten.
Hoe het werkt
De aangepaste categorieën van Azure AI Content Safety maken gebruik van een proces met meerdere stappen voor het maken, trainen en gebruiken van aangepaste modellen voor inhoudsclassificatie. Hier volgt een overzicht van de werkstroom:
Stap 1: Definitie en installatie
Wanneer u een aangepaste categorie definieert, moet u de AI leren welk type inhoud u wilt identificeren. Dit omvat het opgeven van een duidelijke categorienaam en een gedetailleerde definitie die de kenmerken van de inhoud inkapselt.
Vervolgens verzamelt u een evenwichtige gegevensset met positieve en (optioneel) negatieve voorbeelden om de AI te helpen de nuances van uw categorie te leren. Deze gegevens moeten representatief zijn voor de verscheidenheid aan inhoud die het model zal tegenkomen in een praktijkscenario.
Stap 2: Modeltraining
Nadat u uw gegevensset hebt voorbereid en categorieën hebt gedefinieerd, traint de Azure AI Content Safety-service een nieuw machine learning-model. Dit model gebruikt uw definities en geüploade gegevensset om gegevensvergroting uit te voeren met behulp van een groot taalmodel. Als gevolg hiervan wordt de trainingsgegevensset groter en van hogere kwaliteit gemaakt. Tijdens de training analyseert het AI-model de gegevens en leert om onderscheid te maken tussen inhoud die overeenkomt met de opgegeven categorie en inhoud die dat niet doet.
Stap 3: Modeldeductie
Na de training moet u het model evalueren om ervoor te zorgen dat het voldoet aan uw nauwkeurigheidsvereisten. Test het model met nieuwe inhoud die het nog niet eerder heeft ontvangen. De evaluatiefase helpt u bij het identificeren van mogelijke aanpassingen die u nodig hebt om het model in een productieomgeving te implementeren.
Stap 4: Modelgebruik
U gebruikt de analyzeCustomCategory-API om tekstinhoud te analyseren en te bepalen of deze overeenkomt met de aangepaste categorie die u hebt gedefinieerd. De service retourneert een Booleaanse waarde die aangeeft of de inhoud overeenkomt met de opgegeven categorie
Beperkingen
Beschikbaarheid van taal
De API's voor aangepaste categorieën ondersteunen alle talen die worden ondersteund door tekstbeheer voor Inhoudsveiligheid. Raadpleeg Taalondersteuning.
Invoerbeperkingen
Zie de volgende tabel voor de invoerbeperkingen van de aangepaste categorieën (standaard) API:
Object | Beperking |
---|---|
Ondersteunde talen | Alleen in het Engels |
Aantal categorieën per gebruiker | 3 |
Aantal versies per categorie | 3 |
Aantal gelijktijdige builds (processen) per categorie | 1 |
Deductiebewerkingen per seconde | 5 |
Aantal voorbeelden in een categorieversie | Positieve steekproeven (vereist): minimaal 50, maximum 5K In totaal (zowel negatieve als positieve steekproeven): 10.000 Er zijn geen dubbele steekproeven toegestaan. |
Voorbeeldbestandsgrootte | maximaal 128000 bytes |
Lengte van een tekstvoorbeeld | maximaal 125.000 tekens |
Lengte van een categoriedefinitie | maximaal 1000 tekens |
Lengte van een categorienaam | maximaal 128 tekens |
Lengte van een blob-URL | maximaal 500 tekens |