Freigeben über


Verwenden der automatischen Bezeichnung für die benutzerdefinierte Textklassifizierung

Der Bezeichnungsprozess ist ein wichtiger Bestandteil beim Vorbereiten ihres Datasets. Da dieser Prozess viel Zeit und Aufwand erfordert, können Sie die automatische Bezeichnungsfunktion verwenden, um Ihre Dokumente automatisch mit den Klassen zu bezeichnen, in die Sie die Dokumente kategorisieren möchten. Sie können derzeit automatische Bezeichnungsaufträge auf der Grundlage eines Modells starten, das GPT-Modelle verwendet, bei denen Sie sofort einen automatischen Bezeichnungsauftrag auslösen können, ohne zuvor ein Modell zu trainieren. Mit diesem Feature können Sie Zeit und Aufwand im Vergleich zum manuellen Bezeichnen Ihrer Dokumente sparen.

Voraussetzungen

Bevor Sie die automatische Bezeichnung mit GPT verwenden können, benötigen Sie Folgendes:


Auslösen eines automatischen Bezeichnungsauftrags

Wenn Sie einen automatischen Bezeichnungsauftrag mit GPT auslösen, werden Ihnen ihre Azure OpenAI-Ressource gemäß Ihrem Verbrauch in Rechnung gestellt. Ihnen wird eine Schätzung der Anzahl von Token in jedem automatisch bezeichneten Dokument in Rechnung gestellt. Eine detaillierte Aufschlüsselung der Preise pro Token für unterschiedliche Modelle finden Sie auf der Azure OpenAI-Preisseite.

  1. Wählen Sie im linken Navigationsmenü Datenbeschriftung aus.

  2. Wählen Sie im Bereich „Aktivität“ rechts neben der Seite die Schaltfläche Automatische Bezeichnung aus.

    Ein Screenshot zeigt das Auslösen eines Auftrags zur automatischen Markierung im Aktivitätsbereich.

  3. Wählen Sie „Automatische Bezeichnung mit GPT“ und dann „Weiter“ aus.

    Ein Screenshot zeigt die Modellauswahl für die automatische Bezeichnung.

  4. Wählen Sie Ihre Azure OpenAI-Ressource und -Bereitstellung aus. Sie müssen eine Azure OpenAI-Ressource erstellen und ein Modell bereitstellen, um fortzufahren.

    Ein Screenshot zeigt das Auswählen von OpenAI-Ressourcen und -Bereitstellungen

  5. Wählen Sie die Klassen aus, die in den automatischen Bezeichnungsauftrag einbezogen werden sollen. Standardmäßig sind alle Klassen ausgewählt. Beschreibende Namen für Klassen und das Einschließen von Beispielen für jede Klasse werden empfohlen, um eine gute Qualität der Bezeichnungen mit GPT zu erreichen.

    Ein Screenshot, der zeigt, welche Bezeichnungen in den Auftrag für das automatische Markieren einbezogen werden sollen.

  6. Wählen Sie die Dokumente aus, die automatisch bezeichnet werden sollen. Es wird empfohlen, die nicht bezeichneten Dokumente aus dem Filter auszuwählen.

    Hinweis

    • Wenn ein Dokument automatisch bezeichnet wurde, diese Bezeichnung aber bereits benutzerdefinierter war, wird nur die benutzerdefinierte Bezeichnung verwendet.
    • Sie können die Dokumente anzeigen, indem Sie auf den Namen des Dokuments klicken.

    Ein Screenshot, der zeigt, welche Dokumente in den Auftrag für das automatische Markieren einbezogen werden sollen.

  7. Wählen Sie Auftrag starten aus, um den automatischen Bezeichnungsauftrag auszulösen. Sie sollten zur Seite für automatische Bezeichnungen weitergeleitet werden, auf der die initiierten automatischen Bezeichnungsaufträge angezeigt werden. Automatische Bezeichnungsaufträge können zwischen einigen Sekunden und einigen Minuten dauern, abhängig von der Anzahl der von Ihnen eingeschlossenen Dokumente.

    Ein Screenshot zeigt den Überprüfungsbildschirm für einen Auftrag für das automatische Markieren.


Überprüfen der automatisch bezeichneten Dokumente

Wenn der automatische Bezeichnungsauftrag abgeschlossen ist, werden die Ausgabedokumente auf der Seite Datenbeschriftung von Language Studio angezeigt. Wählen Sie Dokumente mit automatischer Bezeichnung überprüfen aus, um die Dokumente mit dem angewendeten Filter Automatische Bezeichnung anzuzeigen.

Ein Screenshot zeigt die automatisch bezeichneten Dokumente

Dokumente, die automatisch klassifiziert wurden, haben im Aktivitätsbereich vorgeschlagene Bezeichnungen, die violett hervorgehoben sind. Jede vorgeschlagene Bezeichnung verfügt über zwei Selektoren (ein Häkchen und ein Löschsymbol), mit denen Sie die automatische Bezeichnung akzeptieren oder ablehnen können.

Sobald eine Bezeichnung akzeptiert wurde, ändert sich die violette Farbe in die blaue Standardfarbe, und die Bezeichnung wird in alle weiteren Modelltrainings einbezogen und wird zu einer benutzerdefinierten Bezeichnung.

Nachdem Sie die Bezeichnungen für die automatisch bezeichneten Dokumente akzeptiert oder abgelehnt haben, wählen Sie Bezeichnungen speichern aus, um die Änderungen anzuwenden.

Hinweis

  • Wir empfehlen, automatisch bezeichnete Entitäten zu überprüfen, bevor Sie diese annehmen.
  • Alle nicht angenommenen Bezeichnungen werden gelöscht, wenn Sie Ihr Modell trainieren.

Ein Screenshot zeigt das Akzeptieren und Ablehnen automatisch bezeichneter Dokumente.

Nächste Schritte