Schnellstart: benutzerdefinierte Zusammenfassung (Vorschau)

In diesem Artikel erfahren Sie, wie Sie ein Projekt für eine benutzerdefinierte Zusammenfassung erstellen, in dem Sie benutzerdefinierte Modelle auf der Grundlage der Zusammenfassung trainieren können. Ein Modell ist KI-Software, die für eine bestimmte Aufgabe trainiert wurde. Bei diesem System fassen die Modelle Text zusammen und werden durch Lernen aus importierten Daten trainiert.

In diesem Artikel wird Language Studio verwendet, um die wichtigsten Konzepte der benutzerdefinierten Zusammenfassung zu demonstrieren. Als Beispiel erstellen Sie ein Modell für eine benutzerdefinierte Zusammenfassung, um die Einrichtung oder den Behandlungsort aus kurzen Entlassungsberichten zu extrahieren.

Voraussetzungen

Erstellen einer neuen Azure KI Language-Ressource und eines Azure-Speicherkontos

Bevor Sie die benutzerdefinierte Zusammenfassung verwenden können, müssen Sie eine Azure KI Language-Ressource erstellen. Sie erhalten dann die Anmeldeinformationen, die Sie benötigen, um ein Projekt zu erstellen und mit dem Training eines Modells zu beginnen. Sie benötigen außerdem ein Azure-Speicherkonto, in das Sie Ihr Dataset hochladen können, das zum Erstellen des Modells verwendet wird.

Wichtig

Um schnell loszulegen, empfehlen wir Ihnen, eine neue Azure KI Language-Ressource anhand der in diesem Artikel beschriebenen Schritte zu erstellen. Mit den Schritten in diesem Artikel können Sie gleichzeitig die Language-Ressource und das Speicherkonto erstellen – das ist einfacher als die Kontoerstellung zu einem späteren Zeitpunkt.

Erstellen einer neuen Ressource im Azure-Portal

  1. Wechseln Sie zum Azure-Portal, um eine neue Azure KI Language-Ressource zu erstellen.

  2. Wählen Sie in dem nun erscheinenden Fenster diesen Dienst aus den benutzerdefinierten Funktionen aus. Wählen Sie unten auf dem Bildschirm Erstellung Ihrer Ressource fortsetzen aus.

    A screenshot showing custom text classification & custom named entity recognition in the Azure portal.

  3. Erstellen Sie eine Sprachressource mit den folgenden Details:

    Name BESCHREIBUNG
    Subscription Ihr Azure-Abonnement.
    Ressourcengruppe Eine Ressourcengruppe, die Ihre Ressource enthält. Sie können eine vorhandene verwenden oder eine neue erstellen.
    Region Die Region Ihrer Sprachressource. Beispiel: „USA, Westen 2“.
    Name Ein Name für Ihre Ressource.
    Tarif Der Tarif für Ihre Sprachressource Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren.

    Hinweis

    Wenn Sie in einer Meldung darauf hingewiesen werden, dass Ihr Anmeldekonto kein Besitzer der Ressourcengruppe des ausgewählten Speicherkontos ist, muss Ihrem Konto eine Besitzerrolle für die Ressourcengruppe zugewiesen werden, bevor Sie eine Sprachressource erstellen können. Wenden Sie sich an den Besitzer des Azure-Abonnements, um Unterstützung zu erhalten.

  4. Wählen Sie im Abschnitt dieses Diensts ein vorhandenes Speicherkonto oder Neues Speicherkonto aus. Diese Werte sollen den Einstieg erleichtern und nicht unbedingt die Speicherkontowerte darstellen, die in Produktionsumgebungen verwendet werden sollten. Um Wartezeit beim Erstellen Ihres Projekts zu vermeiden, sollten Sie eine Verbindung mit Speicherkonten in derselben Region herstellen, in der sich auch Ihre Sprachressource befindet.

    Speicherkontowert Empfohlener Wert
    Speicherkontoname Beliebiger Name
    Speicherkontotyp Standardmäßiger LRS
  5. Stellen Sie sicher, dass die verantwortungsvolle KI-Benachrichtigung überprüft wird. Wählen Sie dann am unteren Rand der Seite die Schaltfläche Überprüfen + Erstellen aus und wählen Sie dann Erstellen aus.

Herunterladen von Beispieldaten

Falls Sie Beispieldaten benötigen, haben wir für diese Schnellstartanleitung einige Szenarien für die Dokumentzusammenfassung und die Konversationszusammenfassung bereitgestellt.

Hochladen von Beispieldaten in den Blobcontainer

  1. Suchen der Dateien, die in Ihr Speicherkonto hochgeladen werden sollen

  2. Navigieren Sie im Azure-Portal zu dem Speicherkonto, das Sie erstellt haben, und wählen Sie es aus.

  3. Klicken Sie in Ihrem Speicherkonto im Menü auf der linken Seite unter Datenspeicher auf Container. Klicken Sie im angezeigten Bildschirm auf + Container. Geben Sie dem Container den Namen example-data, und übernehmen Sie den Standardwert für Öffentliche Zugriffsebene.

    A screenshot showing the main page for a storage account.

  4. Wählen Sie den neu erstellten Container aus. Wählen Sie dann die Schaltfläche Hochladen aus, um die Dateien .txt und .json auszuwählen, die Sie zuvor heruntergeladen haben.

    A screenshot showing the button for uploading files to the storage account.

Erstellen eines Projekts für benutzerdefinierte Zusammenfassung

Nachdem Ihre Ressource und das Speicherkonto konfiguriert wurden, erstellen Sie ein neues benutzerdefiniertes Zusammenfassungsprojekt. Ein Projekt ist ein Arbeitsbereich zum Erstellen Ihrer benutzerdefinierten ML-Modelle auf der Grundlage Ihrer Daten. Auf Ihr Projekt können nur Sie und andere Personen zugreifen, die Zugriff auf die verwendete Sprachressource haben.

  1. Melden Sie sich bei Language Studio an. Es wird ein Fenster angezeigt, in dem Sie Ihr Abonnement und Ihre Sprachressource auswählen können. Wählen Sie die Sprachressource aus, die Sie im Schritt oben erstellt haben.

  2. Wählen Sie das Feature aus, das Sie in Language Studio verwenden möchten.

  3. Wählen Sie im oberen Menü Ihrer Projektseite Neues Projekt erstellen aus. Durch das Erstellen eines Projekts können Sie Daten bezeichnen sowie Ihre Modelle trainieren, auswerten, verbessern und bereitstellen.

    A screenshot of the project creation page.

  4. Geben Sie die Projektinformationen ein, einschließlich eines Namens, einer Beschreibung und der Sprache der Dateien in Ihrem Projekt. Wenn Sie das Beispieldataset verwenden, wählen Sie Englisch aus. Sie können den Namen Ihres Projekts später nicht mehr ändern. Wählen Sie Weiter aus.

    Tipp

    Ihr Dataset muss nicht zur Gänze in derselben Sprache vorliegen. Sie können mehrere Dokumente verwenden, jedes mit jeweils anderen unterstützten Sprachen. Wenn Ihr Dataset Dokumente in verschiedenen Sprachen enthält oder Sie zur Laufzeit mit Text mit verschiedenen Sprachen rechnen, wählen Sie die Option Mehrsprachiges Dataset aktivieren aus, wenn Sie die grundlegenden Informationen für Ihr Projekt eingeben. Diese Option kann später auf der Seite Projekteinstellungen aktiviert werden.

  5. Nachdem Sie Neues Projekt erstellen ausgewählt haben, wird ein Fenster angezeigt, in dem Sie eine Verbindung mit Ihrem Speicherkonto herstellen können. Wenn Sie bereits ein Speicherkonto verbunden haben, wird das verbundene Speicherkonto angezeigt. Falls nicht, wählen Sie Ihr Speicherkonto im angezeigten Dropdownmenü aus, und klicken Sie auf Speicherkonto verbinden. Dadurch werden die erforderlichen Rollen für Ihr Speicherkonto festgelegt. Dieser Schritt gibt möglicherweise einen Fehler zurück, wenn Sie nicht als Besitzer des Speicherkontos zugewiesen sind.

    Hinweis

    • Sie müssen diesen Schritt nur einmal für jede neue Ressource durchführen, die Sie verwenden.
    • Dieser Prozess kann nicht rückgängig gemacht werden – wenn Sie ein Speicherkonto mit Ihrer Sprachressource verbinden, können Sie die Verbindung später nicht trennen.
    • Sie können Ihre Sprachressource nur mit einem Speicherkonto verbinden.
  6. Wählen Sie den Container aus, in den Sie Ihr Dataset hochgeladen haben.

  7. Wenn Sie die Daten bereits beschriftet haben, stellen Sie sicher, dass sie dem unterstützten Format entsprechen, und wählen Sie Ja, meine Dateien sind bereits beschriftet, und ich habe die JSON-Bezeichnungsdatei formatiert. aus. Wählen Sie die Bezeichnungsdatei im Dropdownmenü aus. Wählen Sie Weiter aus. Wenn Sie das Dataset aus der Schnellstartanleitung verwenden, ist es nicht erforderlich, die Formatierung der JSON-Bezeichnungsdatei zu überprüfen.

  8. Überprüfen Sie die eingegebenen Daten, und wählen Sie Projekt erstellen aus.

Trainieren Ihres Modells

Nachdem Sie ein Projekt erstellt haben, beginnen Sie mit dem Trainieren Ihres Modells.

So beginnen Sie das Training Ihres Modells über Language Studio:

  1. Wählen Sie Trainingsaufträge aus dem Menü auf der linken Seite aus.

  2. Wählen Sie im oberen Menü Trainingsauftrag starten aus.

  3. Wählen Sie Neues Modell trainieren aus, und geben Sie den Namen des Modells im Textfeld darunter ein. Sie können auch ein vorhandenes Modell überschreiben, indem Sie diese Option auswählen und das Modell, das Sie überschreiben möchten, im Dropdownmenü auswählen. Das Überschreiben eines trainierten Modells kann nicht rückgängig gemacht werden, wirkt sich jedoch erst auf Ihre bereitgestellten Modelle aus, wenn Sie das neue Modell bereitstellen.

    Create a new training job

  4. Standardmäßig teilt das System Ihre beschrifteten Daten entsprechend den angegebenen Prozentsätzen zwischen den Trainings- und den Testsätzen auf. Wenn Sie Dokumente in Ihrem Testsatz haben, können Sie die Trainings- und Testdaten manuell aufteilen.

  5. Wählen Sie die Schaltfläche Train (Trainieren) aus.

  6. Wenn Sie die Trainingsauftrags-ID in der Liste auswählen, wird ein Seitenbereich angezeigt, in dem Sie den Trainingsfortschritt, den Auftragsstatus und andere Details für diesen Auftrag überprüfen können.

    Hinweis

    • Nur erfolgreich abgeschlossene Trainingsaufträge generieren Modelle.
    • Je nach Größe Ihrer beschrifteten Daten kann das Training wenige Minuten oder mehrere Stunden dauern.
    • Es kann jeweils nur ein Trainingsauftrag ausgeführt werden. Sie können keinen anderen Trainingsauftrag innerhalb desselben Projekts starten, bis der ausgeführte Auftrag abgeschlossen ist.

Bereitstellen Ihres Modells

Im Allgemeinen überprüfen Sie nach dem Trainieren eines Modells seine Auswertungsdetails und nehmen bei Bedarf Verbesserungen vor. In diesem Schnellstart werden Sie nur Ihr Modell bereitstellen und es für Sie selbst zum Ausprobieren in Language Studio verfügbar machen.

So stellen Sie Ihr Modell über Language Studio bereit:

  1. Wählen Sie im Menü auf der linken Seite Bereitstellen eines Modells aus.

  2. Wählen Sie Bereitstellung hinzufügen aus, um einen neuen Bereitstellungsauftrag zu starten.

    A screenshot showing the deployment button

  3. Wählen Sie Neue Bereitstellung erstellen aus, um eine neue Bereitstellung zu erstellen und ein trainiertes Modell aus der Dropdownliste unten zuzuweisen. Sie können auch eine vorhandene Bereitstellung überschreiben, indem Sie diese Option und das trainierte Modell auswählen, das Sie ihr aus der Dropdownliste zuweisen möchten.

    Hinweis

    Das Überschreiben einer vorhandenen Bereitstellung erfordert keine Änderungen an Ihrem Vorhersage-API-Aufruf, aber die Ergebnisse, die Sie erhalten, basieren auf dem neu zugewiesenen Modell.

    A screenshot showing the deployment screen

  4. Wählen Sie Bereitstellen aus, um die Bereitstellungsauftrag zu starten.

  5. Nachdem die Bereitstellung ausgeführt wurde, wird ein Ablaufdatum neben dem Vorgang angezeigt. Der Bereitstellungsablauf ist dann, wenn Ihr bereitgestelltes Modell für die Vorhersage nicht verfügbar ist, was in der Regel zwölf Monate nach Ablauf einer Schulungskonfiguration der Fall ist.

Testen des Modells

In diesem Schnellstart verwenden Sie das Language Studio, um die benutzerdefinierte Zusammenfassungsaufgabe zu übermitteln und die Ergebnisse zu visualisieren. Im zuvor heruntergeladenen Beispieldataset finden Sie einige Testdokumente, die Sie in diesem Schritt verwenden können.

So testen Sie Ihre bereitgestellten Modelle über Language Studio

  1. Wählen Sie Testbereitstellungen aus dem Menü auf der linken Seite aus.

  2. Wählen Sie die Bereitstellung aus, die Sie testen möchten. Sie können nur Modelle testen, die Bereitstellungen zugewiesen sind.

  3. Wählen Sie für mehrsprachige Projekte die Sprache des Textes, den Sie testen möchten, über das Dropdownmenü „Sprache“ aus.

  4. Wählen Sie die Bereitstellung aus der Dropdownliste aus, die Sie abfragen bzw. testen möchten.

  5. Sie können den Text eingeben, den Sie in der Anforderung übermitteln möchten, oder laden Sie eine zu verwendende .txt-Datei hoch.

  6. Wählen Sie im oberen Menü Test ausführen aus.

  7. Auf der Registerkarte Ergebnis sehen Sie die aus Ihrem Text extrahierten Entitäten und ihren Typ. Auf der Registerkarte JSON können Sie außerdem die JSON-Antwort anzeigen.

A screenshot showing the model test results.

Bereinigen von Ressourcen

Wenn Sie Ihr Projekt nicht mehr benötigen, können Sie das Projekt mithilfe von Language Studio löschen. Wählen Sie oben das Feature aus, das Sie verwenden, und wählen Sie dann das Projekt aus, das Sie löschen möchten. Wählen Sie im oberen Menü Löschen aus, um das Projekt zu löschen.

Nächste Schritte