Freigeben über


Beschriften von Textdaten zum Trainieren Ihres Modells für die benutzerdefinierte Stimmungsanalyse

Bevor Sie Ihr Modell trainieren, müssen Sie Ihre Dokumente mit den Stimmungen beschriften, in die sie kategorisiert werden sollen. Diese Daten werden im nächsten Schritt beim Trainieren Ihres Modells verwendet, damit Ihr Modell aus den beschrifteten Daten lernen kann. Wenn Sie bereits über beschriftete Daten verfügen, können Sie diese direkt in Ihr Projekt importieren. Achten Sie darauf, dass Ihre Daten dem akzeptierten Datenformat entsprechen.

Zur Erstellung eines Modells für die benutzerdefinierte Stimmungsanalyse benötigen Sie zunächst beschriftete Daten. Falls Ihre Daten noch nicht beschriftet sind, können Sie sie in Language Studio beschriften. Anhand von beschrifteten Daten kann das Modell bestimmen, wie Text interpretiert werden soll. Auch werden sie zum Trainieren und zur Auswertung verwendet.

Voraussetzungen

Um Daten beschriften zu können, benötigen Sie Folgendes:

Weitere Informationen finden Sie unter Lebenszyklus der Projektentwicklung.

Richtlinien für die Datenbeschriftung

Nach dem Aufbereiten Ihrer Daten und dem Erstellen Ihres Projekts müssen Sie Ihre Daten beschriften. Die Beschriftung Ihrer Daten ist wichtig, um Ihrem Modell mitzuteilen, welche Dokumente den von Ihnen benötigten Stimmungen zugeordnet werden sollen. Wenn Sie Ihre Daten in Language Studio beschriften (oder beschriftete Daten importieren), werden die Bezeichnungen in der JSON-Datei in Ihrem Speichercontainer gespeichert, den Sie mit diesem Projekt verbunden haben.

Beachten Sie beim Beschriften Ihrer Daten Folgendes:

  • Im Allgemeinen führen mehr beschriftete Daten zu besseren Ergebnissen (vorausgesetzt, die Daten sind ordnungsgemäß beschriftet).

  • Es gibt keine feste Anzahl von Bezeichnungen, mit der Ihr Modell am besten funktioniert. Die Modellleistung hängt von einer möglichen Mehrdeutigkeit in Ihren Daten und der Qualität Ihrer beschrifteten Daten ab.

Beschriften Ihrer Daten

Beschriften Sie Ihre Daten wie folgt:

  1. Wechseln Sie in Language Studio zu Ihrer Projektseite.

  2. Wählen Sie im Menü auf der linken Seite die Option Datenbeschriftung aus. Es steht eine Liste mit allen Dokumenten in Ihrem Speichercontainer zur Verfügung.

    Tipp

    Mithilfe der Filter im oberen Menü können Sie unbeschriftete Dateien anzeigen, um mit deren Beschriftung zu beginnen. Sie können mithilfe der Filter auch die Dokumente anzeigen lassen, die mit einer bestimmten Stimmung gekennzeichnet sind.

  3. Wechseln Sie auf der linken Seite des oberen Menüs zu einer Einzeldateiansicht, oder wählen Sie eine bestimmte Datei aus, um mit der Beschriftung zu beginnen. Auf der linken Seite finden Sie eine Liste aller .txt-Dateien, die in Ihren Projekten verfügbar sind. Mithilfe der Schaltflächen Zurück und Weiter am unteren Seitenrand können Sie durch Ihre Dokumente navigieren.

    Hinweis

    Wenn Sie für Ihr Projekt mehrere Sprachen aktiviert haben, können Sie im oberen Menü über die Dropdownliste Sprache die Sprache des jeweiligen Dokuments auswählen.

  4. Im rechten Seitenbereich können Sie Ihrem Projekt Stimmungen hinzufügen, um Ihre Daten damit zu beschriften.

  5. Im rechten Seitenbereich unter dem Pivotelement Beschriftungen finden Sie alle Stimmungen in Ihrem Projekt sowie die jeweilige Anzahl beschrifteter Instanzen.

  6. Im unteren Abschnitt des Bereichs auf der rechten Seite können Sie die aktuell angezeigte Datei dem Trainingssatz oder dem Testsatz hinzufügen. Standardmäßig werden alle Dokumente Ihrem Trainingssatz hinzugefügt. Weitere Informationen zu Schulungs- und Testsätzen sowie zu ihrer Verwendung beim Trainieren und Auswerten von Modellen finden Sie hier.

    Tipp

    Wenn Sie die automatische Datenaufteilung verwenden möchten, verwenden Sie die Standardoption, mit der alle Dokumente in Ihrem Trainingssatz zugewiesen werden.

  7. Unter dem Pivotelement Verteilung können Sie die Verteilung in den Schulungs- und Testsätzen anzeigen. Es gibt zwei Ansichtsoptionen:

    • Instanzen gesamt: Hier können Sie die Anzahl aller beschrifteten Instanzen einer bestimmten Stimmung anzeigen.
    • Dokumente mit mindestens einer Beschriftung: Jedes Dokument wird gezählt, wenn es mindestens eine beschriftete Instanz dieser Stimmung enthält.
  8. Während der Beschriftung werden Ihre Änderungen in regelmäßigen Abständen synchronisiert. Wenn sie noch nicht gespeichert wurden, wird oben auf der Seite eine Warnung eingeblendet. Wenn Sie manuell speichern möchten, können Sie unten auf der Seite auf die Schaltfläche Bezeichnungen speichern klicken.

Nächste Schritte

Nachdem Sie Ihre Daten beschriftet haben, können Sie mit dem Trainieren eines Modells beginnen, das auf der Grundlage Ihrer Daten lernt.