Verwenden der automatischen Bezeichnung für die benutzerdefinierte Textklassifizierung
Der Bezeichnungsprozess ist ein wichtiger Bestandteil beim Vorbereiten ihres Datasets. Da dieser Prozess viel Zeit und Aufwand erfordert, können Sie die automatische Bezeichnungsfunktion verwenden, um Ihre Dokumente automatisch mit den Klassen zu bezeichnen, in die Sie die Dokumente kategorisieren möchten. Sie können derzeit automatische Bezeichnungsaufträge auf der Grundlage eines Modells starten, das GPT-Modelle verwendet, bei denen Sie sofort einen automatischen Bezeichnungsauftrag auslösen können, ohne zuvor ein Modell zu trainieren. Mit diesem Feature können Sie Zeit und Aufwand im Vergleich zum manuellen Bezeichnen Ihrer Dokumente sparen.
Voraussetzungen
Bevor Sie die automatische Bezeichnung mit GPT verwenden können, benötigen Sie Folgendes:
- Ein erfolgreich erstelltes Projekt mit einem konfigurierten Azure Blob Storage-Konto
- Textdaten, die in Ihr Speicherkonto hochgeladen wurden
- Klassennamen, die aussagekräftig sind. Die GPT-Modelle bezeichnen Dokumente basierend auf den Namen der von Ihnen bereitgestellten Klassen.
- Bezeichnete Daten sind nicht erforderlich.
- Eine Azure OpenAI-Ressource und -Bereitstellung.
Auslösen eines automatischen Bezeichnungsauftrags
Wenn Sie einen automatischen Bezeichnungsauftrag mit GPT auslösen, werden Ihnen ihre Azure OpenAI-Ressource gemäß Ihrem Verbrauch in Rechnung gestellt. Ihnen wird eine Schätzung der Anzahl von Token in jedem automatisch bezeichneten Dokument in Rechnung gestellt. Eine detaillierte Aufschlüsselung der Preise pro Token für unterschiedliche Modelle finden Sie auf der Azure OpenAI-Preisseite.
Wählen Sie im linken Navigationsmenü Datenbeschriftung aus.
Wählen Sie im Bereich „Aktivität“ rechts neben der Seite die Schaltfläche Automatische Bezeichnung aus.
Wählen Sie „Automatische Bezeichnung mit GPT“ und dann „Weiter“ aus.
Wählen Sie Ihre Azure OpenAI-Ressource und -Bereitstellung aus. Sie müssen eine Azure OpenAI-Ressource erstellen und ein Modell bereitstellen, um fortzufahren.
Wählen Sie die Klassen aus, die in den automatischen Bezeichnungsauftrag einbezogen werden sollen. Standardmäßig sind alle Klassen ausgewählt. Beschreibende Namen für Klassen und das Einschließen von Beispielen für jede Klasse werden empfohlen, um eine gute Qualität der Bezeichnungen mit GPT zu erreichen.
Wählen Sie die Dokumente aus, die automatisch bezeichnet werden sollen. Es wird empfohlen, die nicht bezeichneten Dokumente aus dem Filter auszuwählen.
Hinweis
- Wenn ein Dokument automatisch bezeichnet wurde, diese Bezeichnung aber bereits benutzerdefinierter war, wird nur die benutzerdefinierte Bezeichnung verwendet.
- Sie können die Dokumente anzeigen, indem Sie auf den Namen des Dokuments klicken.
Wählen Sie Auftrag starten aus, um den automatischen Bezeichnungsauftrag auszulösen. Sie sollten zur Seite für automatische Bezeichnungen weitergeleitet werden, auf der die initiierten automatischen Bezeichnungsaufträge angezeigt werden. Automatische Bezeichnungsaufträge können zwischen einigen Sekunden und einigen Minuten dauern, abhängig von der Anzahl der von Ihnen eingeschlossenen Dokumente.
Überprüfen der automatisch bezeichneten Dokumente
Wenn der automatische Bezeichnungsauftrag abgeschlossen ist, werden die Ausgabedokumente auf der Seite Datenbeschriftung von Language Studio angezeigt. Wählen Sie Dokumente mit automatischer Bezeichnung überprüfen aus, um die Dokumente mit dem angewendeten Filter Automatische Bezeichnung anzuzeigen.
Dokumente, die automatisch klassifiziert wurden, haben im Aktivitätsbereich vorgeschlagene Bezeichnungen, die violett hervorgehoben sind. Jede vorgeschlagene Bezeichnung verfügt über zwei Selektoren (ein Häkchen und ein Löschsymbol), mit denen Sie die automatische Bezeichnung akzeptieren oder ablehnen können.
Sobald eine Bezeichnung akzeptiert wurde, ändert sich die violette Farbe in die blaue Standardfarbe, und die Bezeichnung wird in alle weiteren Modelltrainings einbezogen und wird zu einer benutzerdefinierten Bezeichnung.
Nachdem Sie die Bezeichnungen für die automatisch bezeichneten Dokumente akzeptiert oder abgelehnt haben, wählen Sie Bezeichnungen speichern aus, um die Änderungen anzuwenden.
Hinweis
- Wir empfehlen, automatisch bezeichnete Entitäten zu überprüfen, bevor Sie diese annehmen.
- Alle nicht angenommenen Bezeichnungen werden gelöscht, wenn Sie Ihr Modell trainieren.
Nächste Schritte
- Weitere Informationen zum Bezeichnen Ihrer Daten.