Benutzerdefinierte Kategorien (Vorschau)
Mit Azure KI Inhaltssicherheit können Sie eigene Inhaltsmoderationskategorien erstellen und verwalten, um eine verbesserte Moderation und Filterung zu ermöglichen, die Ihren spezifischen Richtlinien oder Anwendungsfällen entspricht.
Anpassungsmöglichkeiten
Es gibt mehrere Möglichkeiten zum Definieren und Verwenden von benutzerdefinierten Kategorien, die in diesem Abschnitt vorgestellt und verglichen werden.
API | Funktionalität |
---|---|
API für benutzerdefinierte Kategorien (Standard) | Verwenden Sie ein anpassbares Machine Learning-Modell, um eine benutzerdefinierte Kategorie zu erstellen, abzurufen, abzufragen und zu löschen. Oder listen Sie alle benutzerdefinierten Kategorien für weitere Anmerkungsaufgaben auf. |
API für benutzerdefinierte Kategorien (Schnell) | Verwenden Sie ein großes Sprachmodell (LLM), um schnell bestimmte Inhaltsmuster in neuen Inhaltsvorfällen zu erlernen. |
API für benutzerdefinierte Kategorien (Standard)
Mit der API für benutzerdefinierte Kategorien (Standard) können Kund*innen Kategorien definieren, die für ihre Anforderungen spezifisch sind, Beispieldaten bereitstellen, ein benutzerdefiniertes Machine Learning-Modell trainieren und diese verwenden, um neue Inhalte gemäß den gelernten Kategorien zu klassifizieren.
Dies ist der Standardworkflow zum Anpassen mit Machine Learning-Modellen. Abhängig von der Qualität der Trainingsdaten kann ein solches Modell sehr gute Leistungsniveaus erreichen. Es kann jedoch bis zu mehrere Stunden dauern, um das Modell zu trainieren.
Diese Implementierung funktioniert bei Textinhalten, nicht bei Bildinhalten.
API für benutzerdefinierte Kategorien (schnell)
Die API für benutzerdefinierte Kategorien (Schnell) ist so konzipiert, dass sie schneller und flexibler als die Standardmethode ist. Sie soll zur Identifizierung, Analyse und Beseitigung von sowie der Wiederherstellung nach Cybervorfällen, die unangemessene oder schädliche Inhalte auf Onlineplattformen umfassen, eingesetzt werden.
Ein Incident kann eine Reihe von neuen Inhaltsmustern (Text, Bild oder anderen Modalitäten) umfassen, die gegen Microsoft-Communityrichtlinien oder die eigenen Richtlinien und Erwartungen der Kunden verstoßen. Diesen Incidents muss schnell und präzise entgegengewirkt werden, um potenzielle Probleme mit Livewebsites oder Schäden für Benutzer und Communitys zu vermeiden.
Diese Implementierung funktioniert für Textinhalte und Bildinhalte.
Tipp
Eine Möglichkeit zum Umgang mit neuen Inhaltsincidents besteht darin, Blocklisten zu verwenden. Diese ermöglichen jedoch nur exakten Textabgleich und keinen Bildabgleich. Die API für benutzerdefinierte Kategorien (Schnell) bietet die folgenden erweiterten Funktionen:
- semantischer Textabgleich mithilfe der Einbettungssuche mit einem schlanken Klassifizierer
- Bildabgleich mit einem schlanken Objektverfolgungsmodell und Einbettungssuche
Funktionsweise
Die Funktion für benutzerdefinierte Kategorien von Azure KI Inhaltssicherheit verwendet einen mehrstufigen Prozess zum Erstellen, Trainieren und Verwenden von benutzerdefinierten Inhaltsklassifizierungsmodellen. So sieht der Workflow aus:
Schritt 1: Definition und Einrichtung
Wenn Sie eine benutzerdefinierte Kategorie definieren, müssen Sie der KI vermitteln, welche Art von Inhalten Sie identifizieren möchten. Dies umfasst die Bereitstellung eines eindeutigen Kategorienamens und eine detaillierte Definition, die die Eigenschaften des Inhalts enthält.
Anschließend sammeln Sie ein ausgewogenes Dataset mit positiven und (optional) negativen Beispielen, um die KI dabei zu unterstützen, die Nuancen Ihrer Kategorie zu erlernen. Diese Daten sollten repräsentativ für die Vielfalt der Inhalte sein, die das Modell in einem realen Szenario findet.
Schritt 2: Modelltraining
Nachdem Sie Ihr Dataset vorbereitet und Kategorien definiert haben, trainiert der Azure KI Inhaltssicherheit-Dienst ein neues Machine Learning-Modell. Dieses Modell verwendet Ihre Definitionen und hochgeladenen Datasets, um eine Datenerweiterung mithilfe eines großen Sprachmodells durchzuführen. Dadurch wird das Trainingsdatenset größer und von höherer Qualität. Während des Trainings analysiert das KI-Modell die Daten und lernt, zwischen Inhalten zu unterscheiden, die mit der angegebenen Kategorie übereinstimmen und Inhalten, ihr die nicht entsprechen.
Schritt 3: Modellrückschluss
Nach dem Training müssen Sie das Modell auswerten, um sicherzustellen, dass es Ihre Genauigkeitsanforderungen erfüllt. Testen Sie das Modell mit neuen Inhalten, die es noch nicht kennt. In der Bewertungsphase können Sie ermitteln, welche Anpassungen Sie möglicherweise vornehmen müssen, um das Modell in einer Produktionsumgebung einzusetzen.
Schritt 4: Modellverwendung
Sie verwenden die analyzeCustomCategory-API, um Textinhalte zu analysieren und zu bestimmen, ob sie der von Ihnen definierten benutzerdefinierten Kategorie entsprechen. Der Dienst gibt einen Booleschen Wert zurück, der angibt, ob der Inhalt zur angegebenen Kategorie passt.
Begrenzungen
Verfügbarkeit der Sprache
Die APIs für benutzerdefinierte Kategorien unterstützen alle Sprachen, die von der Inhaltssicherheitstextmoderation unterstützt werden. Informationen hierzu finden Sie unter Sprach- und Stimmunterstützung für den Speech-Dienst.
Eingabebeschränkungen
In der folgenden Tabelle finden Sie die Eingabebeschränkungen der API für benutzerdefinierte Kategorien (Schnell):
Objekt | Einschränkung |
---|---|
Unterstützte Sprachen | Nur auf Englisch |
Anzahl der Kategorien pro Benutzer*in | 3 |
Anzahl der Versionen pro Kategorie | 3 |
Anzahl gleichzeitiger Builds (Prozesse) pro Kategorie | 1 |
Rückschlussvorgänge pro Sekunde | 5 |
Anzahl der Beispiele in einer Kategorieversion | Positivbeispiele (erforderlich): mindestens 50, maximal 5.000 Insgesamt (sowohl Negativ- als auch Positivbeispiele): 10.000 Es sind keine duplizierten Beispiele zulässig. |
Beispieldateigröße | maximal 128.000 Byte |
Länge eines Textbeispiels | maximal 125.000 Zeichen |
Länge einer Kategoriedefinition | maximal 1.000 Zeichen |
Länge eines Kategorienamens | maximal 128 Zeichen |
Länge einer Blob-URL | maximal 500 Zeichen |