Schnellstart: Benutzerdefinierte Kategorien (Standardmodus) (Vorschau)
In diesem Leitfaden erfahren Sie, wie Sie mithilfe der REST-API für benutzerdefinierte Kategorien (Standard) von Azure KI Inhaltssicherheit eigene Inhaltskategorien für Ihren Anwendungsfall erstellen und Azure KI Inhaltssicherheit so trainieren, dass diese in neuen Textinhalten erkannt werden.
Weitere Informationen zu benutzerdefinierten Kategorien finden Sie auf der Seite Konzept „Benutzerdefinierte Kategorien“. Informationen zu API-Eingabegrenzwerten finden Sie im Abschnitt Eingabeanforderungen der Übersicht.
Wichtig
Dieses Feature ist nur in bestimmten Azure-Regionen verfügbar. Weitere Informationen finden Sie unter Regionale Verfügbarkeit.
Wichtig
Ausreichend Zeit für das Modelltraining einplanen
Die End-to-End-Ausführung des Trainings einer benutzerdefinierten Kategorie kann fünf bis zehn Stunden dauern. Planen Sie Ihre Moderationspipeline entsprechend.
Benutzerdefinierte Kategorien (Standardmodus) (Vorschau) – Benutzerflow
Voraussetzungen
- Azure-Abonnement: Kostenloses Azure-Konto
- Sobald Sie über ein Azure-Abonnement verfügen, können Sie im Azure-Portal eine Content Safety-Ressource erstellen, um Ihren Schlüssel und Endpunkt abzurufen. Geben Sie für Ihre Ressource einen eindeutigen Namen ein. Wählen Sie Ihr Abonnement aus, und wählen Sie dann eine Ressourcengruppe, eine unterstützte Region und einen unterstützten Tarif. Klicken Sie anschließend auf Erstellen.
- Die Bereitstellung der Ressource dauert einige Minuten. Wählen Sie im Anschluss Zu Ressource wechseln aus. Wählen Sie im linken Bereich unter Ressourcenverwaltung die Option Abonnementschlüssel und Endpunkt aus. Kopieren Sie den Endpunkt und einen der Schlüsselwerte an einen temporären Speicherort für die spätere Verwendung.
- Erstellen Sie außerdem einen Azure Blob Storage-Container, in dem Sie Ihre Trainingsanmerkungsdatei beibehalten.
- Installation einer der folgenden Optionen:
- cURL für REST-API-Aufrufe
- Installation von Python 3.x
Vorbereiten Ihrer Trainingsdaten
Zum Trainieren einer benutzerdefinierten Kategorie benötigen Sie Beispieltextdaten, die die Kategorie darstellen, die erkannt werden soll. In diesem Leitfaden können Sie Beispieldaten verwenden. Die bereitgestellte Anmerkungsdatei enthält Textaufforderungen zu Überlebenstipps in Camping- und Wildnissituationen. Das trainierte Modell lernt, diese Art von Inhalt in neuen Textdaten zu erkennen.
Tipp
Tipps zum Erstellen ihres eigenen Datasets finden Sie in der Schrittanleitung.
- Laden Sie die Beispieltextdatendatei aus dem GitHub-Repository herunter.
- Laden Sie die JSONL-Datei in Ihren Blob-Container ihres Azure Storage-Kontos hoch. Kopieren Sie dann die Blob-URL an einen temporären Speicherort für die spätere Verwendung.
Gewähren des Speicherzugriffs
Als Nächstes müssen Sie Ihrer Content Safety-Ressource Zugriff gewähren, um Daten aus der Azure Storage-Ressource lesen zu können. Aktivieren Sie die systemseitig zugewiesene verwaltete Identität für die Azure KI Inhaltssicherheit-Instanz, und weisen Sie der Identität die Rolle Mitwirkender/Besitzer von Speicherblobdaten zu:
Wichtig
Nur Speicherblobdaten-Mitwirkender oder Speicherblobdaten-Besitzer sind gültige Rollen, um fortzufahren.
Aktivieren Sie die verwaltete Identität für die Azure KI Content Safety-Instanz.
Weisen Sie der verwalteten Identität die Rolle Mitwirkender an/Besitzer von Storage-Blobdaten zu. Alle nachstehend hervorgehobenen Rollen sollten funktionieren.
Erstellen und Trainieren einer benutzerdefinierten Kategorie
Ersetzen Sie in den folgenden Befehlen <your_api_key>
, <your_endpoint>
und andere erforderliche Parameter durch Ihre eigenen Werte. Geben Sie dann jeden Befehl in ein Terminalfenster ein, und führen Sie ihn aus.
Erstellen einer neuen Kategorieversion
curl -X PUT "<your_endpoint>/contentsafety/text/categories/survival-advice?api-version=2024-09-15-preview" \
-H "Ocp-Apim-Subscription-Key: <your_api_key>" \
-H "Content-Type: application/json" \
-d "{
\"categoryName\": \"survival-advice\",
\"definition\": \"text prompts about survival advice in camping/wilderness situations\",
\"sampleBlobUrl\": \"https://<your-azure-storage-url>/example-container/survival-advice.jsonl\"
}"
Tipp
Jedes Mal, wenn Sie ihren Kategorienamen, Ihre Definition oder Beispiele ändern, wird eine neue Version erstellt. Sie können die Versionsnummer verwenden, um zu früheren Versionen zurückzukehren. Bitte merken Sie sich diese Versionsnummer, da sie in der URL für den nächsten Schritt erforderlich ist – Training benutzerdefinierter Kategorien.
Abrufen einer neuen Kategorieversion
curl -X PUT "<your_endpoint>/contentsafety/text/categories/survival-advice?api-version=2024-09-15-preview" \
-H "Ocp-Apim-Subscription-Key: <your_api_key>" \
-H "Content-Type: application/json" \
-d "{
\"categoryName\": \"survival-advice\",
\"definition\": \"text prompts about survival advice in camping/wilderness situations\",
\"sampleBlobUrl\": \"https://<your-azure-storage-url>/example-container/survival-advice.jsonl\"
}"
Starten Sie den Kategoriebuildprozess:
Ersetzen Sie <your_api_key> und <your_endpoint> durch Ihre eigenen Werte, und fügen Sie auch die Versionsnummer an, die Sie aus dem letzten Schritt erhalten haben. Planen Sie ausreichend Zeit für das Modelltraining ein: Die End-to-End-Ausführung des Trainings einer benutzerdefinierten Kategorie kann fünf bis zehn Stunden dauern. Planen Sie Ihre Moderationspipeline entsprechend. Nachdem Sie die Antwort erhalten haben, speichern Sie die Vorgangs-ID (genannt id
) an einem temporären Speicherort. Diese ID ist erforderlich, um den Buildstatus mithilfe der Get-Status-API im nächsten Abschnitt abzurufen.
curl -X POST "<your_endpoint>/contentsafety/text/categories/survival-advice:build?api-version=2024-09-15-preview&version={version}" \
-H "Ocp-Apim-Subscription-Key: <your_api_key>" \
-H "Content-Type: application/json"
Abrufen des Kategoriebuildstatus:
Um den Status abzurufen, verwenden Sie die id
aus der vorherigen API-Antwort, und platzieren Sie sie im Pfad der folgenden API.
curl -X GET "<your_endpoint>/contentsafety/text/categories/operations/<id>?api-version=2024-09-15-preview" \
-H "Ocp-Apim-Subscription-Key: <your_api_key>" \
-H "Content-Type: application/json"
Analysieren von Text mit einer benutzerdefinierten Kategorie
Führen Sie den folgenden Befehl aus, um Text mit Ihrer benutzerdefinierten Kategorie zu analysieren. Ersetzen Sie <your_api_key>
und <your_endpoint>
durch Ihre eigenen Werte.
curl -X POST "<your_endpoint>/contentsafety/text:analyzeCustomCategory?api-version=2024-09-15-preview" \
-H "Ocp-Apim-Subscription-Key: <your_api_key>" \
-H "Content-Type: application/json" \
-d "{
\"text\": \"<Example text to analyze>\",
\"categoryName\": \"survival-advice\",
\"version\": 1
}"
Zugehöriger Inhalt
- Informationen zu anderen Vorgängen für benutzerdefinierte Kategorien finden Sie in der Schrittanleitung.
- Konzepte für benutzerdefinierte Kategorien
- Moderieren von Inhalten mit Inhaltssicherheit