Erstellen eines Projekts für benutzerdefinierte NER

Artikel
12/19/2023

In diesem Artikel erfahren Sie, wie Sie die Anforderungen einrichten, um mit der benutzerdefinierten NER zu beginnen, und ein Projekt erstellen.

Voraussetzungen

Bevor Sie mit der Verwendung der benutzerdefinierten NER beginnen, benötigen Sie Folgendes:

Azure-Abonnement – kostenloses Abonnement erstellen.

Erstellen einer Language-Ressource

Bevor Sie eine benutzerdefinierte NER verwenden, benötigen Sie eine Azure KI Language-Ressource. Es wird empfohlen, Ihre Sprachressource zu erstellen und ein Speicherkonto im Azure-Portal damit zu verknüpfen. Wenn Sie eine Ressource im Azure-Portal erstellen, können Sie gleichzeitig ein Azure-Speicherkonto erstellen, wobei alle erforderlichen Berechtigungen vorkonfiguriert sind. Sie können in diesem Artikel auch weiterlesen, um zu erfahren, wie Sie eine bereits vorhandene Ressource verwenden und für die Verwendung mit benutzerdefinierter benannter Entitätserkennung konfigurieren.

Darüber hinaus benötigen Sie ein Azure-Speicherkonto, in das Sie Ihre .txt-Dokumente hochladen, die zum Trainieren eines Modells zum Extrahieren von Entitäten verwendet werden sollen.

Hinweis

Ihnen muss die Rolle Besitzer für die Ressourcengruppe zugewiesen sein, damit Sie eine Sprachressource erstellen können.
Wenn Sie eine Verbindung mit einem vorhandenen Speicherkonto herstellen, sollte ihm die Rolle Besitzer zugewiesen sein.

Erstellen von Sprachressourcen und Verbinden eines Speicherkontos

Sie können eine Ressource auf folgende Arten erstellen:

Das Azure-Portal
Language Studio
PowerShell

Hinweis

Sie sollten das Speicherkonto nicht in eine andere Ressourcengruppe oder ein Abonnement verschieben, nachdem es mit der Sprachressource verknüpft wurde.

Erstellen einer neuen Ressource im Azure-Portal

Melden Sie sich beim Azure-Portal an, um eine neue Azure KI Language-Ressource zu erstellen.
Wählen Sie im angezeigten Fenster in den benutzerdefinierten Features Benutzerdefinierte Textklassifizierung und benutzerdefinierte Erkennung benannter Entitäten aus. Wählen Sie unten auf dem Bildschirm Erstellung Ihrer Ressource fortsetzen aus.

Erstellen Sie eine Sprachressource mit den folgenden Details:

Name	BESCHREIBUNG
Subscription	Ihr Azure-Abonnement.
Ressourcengruppe	Eine Ressourcengruppe, die Ihre Ressource enthält. Sie können eine vorhandene verwenden oder eine neue erstellen.
Region	Die Region Ihrer Sprachressource. Beispiel: „USA, Westen 2“.
Name	Ein Name für Ihre Ressource.
Tarif	Der Tarif für Ihre Sprachressource Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren.

Hinweis

Wenn Sie in einer Meldung darauf hingewiesen werden, dass Ihr Anmeldekonto kein Besitzer der Ressourcengruppe des ausgewählten Speicherkontos ist, muss Ihrem Konto eine Besitzerrolle für die Ressourcengruppe zugewiesen werden, bevor Sie eine Sprachressource erstellen können. Wenden Sie sich an den Besitzer des Azure-Abonnements, um Unterstützung zu erhalten.

Wählen Sie im Abschnitt Benutzerdefinierte Textklassifizierung und benutzerdefinierte Erkennung benannter Entitäten ein vorhandenes Speicherkonto aus, oder wählen Sie Neues Speicherkonto aus. Diese Werte sollen den Einstieg erleichtern und nicht unbedingt die Speicherkontowerte darstellen, die in Produktionsumgebungen verwendet werden sollten. Um Wartezeit beim Erstellen Ihres Projekts zu vermeiden, sollten Sie eine Verbindung mit Speicherkonten in derselben Region herstellen, in der sich auch Ihre Sprachressource befindet.

Speicherkontowert Empfohlener Wert

Speicherkontoname Beliebiger Name

Speicherkontotyp Standardmäßiger LRS
Stellen Sie sicher, dass die verantwortungsvolle KI-Benachrichtigung überprüft wird. Wählen Sie am unteren Seitenrand Überprüfen und erstellen und dann Erstellen aus.

Speicherkontowert	Empfohlener Wert
Speicherkontoname	Beliebiger Name
Speicherkontotyp	Standardmäßiger LRS

Erstellen einer neuen Sprachressource über Language Studio

Wenn Sie sich zum ersten Mal anmelden, wird in Language Studio ein Fenster angezeigt, in dem Sie eine vorhandene Sprachressource auswählen oder eine neue erstellen können. Sie können eine Ressource auch erstellen, indem Sie auf das Einstellungssymbol in der oberen rechten Ecke klicken, Ressourcen auswählen und dann auf Neue Ressource erstellen klicken.

Erstellen Sie eine Sprachressource mit den folgenden Details:

Instanzdetails	Erforderlicher Wert
Azure-Abonnement	Ihr Azure-Abonnement
Azure-Ressourcengruppe	Ihre Azure-Ressourcengruppe
Name der Azure-Ressource	Ihr Azure-Ressourcenname
Standort	Die Region Ihrer Sprachressource
Tarif	Der Tarif Ihrer Sprachressource

Wichtig

Achten Sie darauf, dass Sie Verwaltete Identität aktivieren, wenn Sie eine Sprachressource erstellen.
Lesen und Bestätigen des Hinweises zu verantwortungsvoller KI

Falls Sie noch nicht über ein Konto verfügen, müssen Sie ein Azure-Speicherkonto erstellen, um die benutzerdefinierte benannte Entitätserkennung verwenden zu können.

Erstellen einer neuen Sprachressource mithilfe von PowerShell

Sie können eine neue Ressource und ein Speicherkonto mithilfe der folgenden CLI-Vorlage und Parameterdateien erstellen, die auf GitHub gehostet werden.

Bearbeiten Sie die folgenden Werte in der Parameterdatei:

Parametername	Wertbeschreibung
`name`	Name Ihrer Sprachressource
`location`	Region, in der Ihre Ressource gehostet wird. Weitere Informationen finden Sie unter Diensteinschränkungen.
`sku`	Tarif Ihrer Ressource
`storageResourceName`	Name Ihres Speicherkontos
`storageLocation`	Region, in der Ihr Speicherkonto gehostet wird.
`storageSkuType`	SKU Ihres Speicherkontos.
`storageResourceGroupName`	Ressourcengruppe Ihres Speicherkontos

Verwenden Sie den folgenden PowerShell-Befehl, um die ARM-Vorlage (Azure Resource Manager) mit den von Ihnen bearbeiteten Dateien bereitzustellen.

New-AzResourceGroupDeployment -Name ExampleDeployment -ResourceGroupName ExampleResourceGroup `
  -TemplateFile <path-to-arm-template> `
  -TemplateParameterFile <path-to-parameters-file>

Informationen zum Bereitstellen von Vorlagen und zu Parameterdateienfinden Sie in der ARM-Vorlagendokumentation.

Hinweis

Der Prozess zum Verbinden eines Speicherkontos mit Ihrer Sprachressource kann nicht rückgängig gemacht werden. Die Verbindung kann später nicht getrennt werden.
Sie können Ihre Sprachressource nur mit einem Speicherkonto verbinden.

Verwenden einer bereits vorhandenen Sprachressource

Sie können eine vorhandene Sprachressource verwenden, um mit der benutzerdefinierten NER zu beginnen, solange diese Ressource die folgenden Anforderungen erfüllt:

Anforderung	BESCHREIBUNG
Regions	Stellen Sie sicher, dass Ihre vorhandene Ressource in einer der unterstützten Regionen bereitgestellt wird. Andernfalls müssen Sie eine neue Ressource in einer dieser Regionen erstellen.
Tarif	Weitere Informationen zu unterstützten Tarifen finden Sie hier.
Verwaltete Identität	Stellen Sie sicher, dass die Einstellung für die verwaltete Identität der Ressource aktiviert ist. Lesen Sie andernfalls den nächsten Abschnitt.

Falls Sie noch nicht über ein Konto verfügen, müssen Sie ein Azure-Speicherkonto erstellen, um die benutzerdefinierte benannte Entitätserkennung verwenden zu können.

Aktivieren der Identitätsverwaltung für Ihre Ressource

Azure portal
Language Studio

Für Ihre Language-Ressource muss die Identitätsverwaltung aktiviert sein. Aktivieren Sie sie wie folgt über das Azure-Portal:

Navigieren Sie zu Ihrer Sprachressource.
Wählen Sie im Menü auf der linken Seite unter Ressourcenverwaltung die Option Identität aus.
Legen Sie auf der Registerkarte Systemseitig zugewiesen die Option Status unbedingt auf Ein fest.

Aktivieren des Features „Benutzerdefinierte benannte Entitätserkennung“

Aktivieren Sie unbedingt das Feature Benutzerdefinierte Textklassifizierung/Benutzerdefinierte benannte Entitätserkennung im Azure-Portal.

Wechseln Sie im Azure-Portal zu Ihrer Sprachressource.
Wählen Sie im Menü auf der linken Seite im Abschnitt Ressourcenverwaltung die Option Features aus.
Aktivieren Sie das Feature Benutzerdefinierte Textklassifizierung/Benutzerdefinierte benannte Entitätserkennung.
Stellen Sie eine Verbindung mit Ihrem Speicherkonto her.
Wählen Sie Übernehmen.

Wichtig

Vergewissern Sie sich, dass Ihrer Sprachressource die Rolle Mitwirkender an Storage-Blobdaten für das Speicherkonto zugewiesen ist, mit dem Sie eine Verbindung herstellen.

Hinzufügen erforderlicher Rollen

Führen Sie die folgenden Schritte aus, um die erforderlichen Rollen für Ihr Sprachressource und Ihr Speicherkonto festzulegen.

Rollen für Ihre Azure KI Language-Ressource

Wechseln Sie im Azure-Portal zu Ihrem Speicherkonto oder Ihrer Sprachressource.
Wählen Sie im linken Navigationsmenü Access Control (IAM) aus.
Wählen Sie Hinzufügen aus, um Rollenzuweisungen hinzuzufügen, und wählen Sie dann die entsprechende Rolle für Ihr Konto aus.

Ihnen sollte die Rolle Besitzer oder Mitwirkender für Ihre Sprachressource zugewiesen sein.
Wählen Sie unter Zugriff zuweisen zu die Option Benutzer, Gruppe oder Dienstprinzipal aus.
Wählen Sie Mitglieder auswählen aus.
Wählen Sie Ihren Benutzernamen aus. Sie können im Feld Auswählen nach Benutzernamen suchen. Wiederholen Sie diesen Vorgang für alle Rollen.
Wiederholen Sie diese Schritte für alle Benutzerkonten, die Zugriff auf diese Ressource benötigen.

Rollen für Ihr Speicherkonto

Navigieren Sie im Azure-Portal zu Ihrem Speicherkonto.
Wählen Sie im linken Navigationsmenü Access Control (IAM) aus.
Wählen Sie Hinzufügen aus, um Rollenzuweisungen hinzuzufügen, und wählen Sie dann die Rolle Mitwirkender an Storage-Blobdaten für das Speicherkonto aus.
Wählen Sie unter Zugriff zuweisen zu die Option Verwaltete Identität aus.
Wählen Sie Mitglieder auswählen aus.
Wählen Sie Ihr Abonnement und Sprache als verwaltete Identität aus. Sie können im Feld Auswählen nach Benutzernamen suchen.

Wichtig

Wenn Sie über ein virtuelles Netzwerk oder einen privaten Endpunkt verfügen, achten Sie darauf, Azure-Diensten auf der Liste der vertrauenswürdigen Dienste den Zugriff auf dieses Speicherkonto erlauben im Azure-Portal zu aktivieren.

Aktivieren von CORS für Ihr Speicherkonto

Achten Sie darauf, Methoden (GET, PUT, DELETE) zuzulassen, wenn Sie CORS (Cross-Origin Resource Sharing) aktivieren. Legen Sie das Feld „Zulässige Ursprünge“ auf https://language.cognitive.azure.com fest. Lassen Sie alle Header zu, indem Sie den Werten für zulässige Header * hinzufügen, und legen Sie das maximale Alter auf 500 fest.

Erstellen eines benutzerdefinierten Projekts zur Erkennung benannter Entitäten

Nachdem Ihre Ressource und der Speichercontainer konfiguriert wurden, erstellen Sie ein neues benutzerdefiniertes NER-Projekt. Ein Projekt ist ein Arbeitsbereich zum Erstellen Ihrer benutzerdefinierten KI-Modelle auf der Grundlage Ihrer Daten. Auf Ihr Projekt können nur Sie und andere Personen zugreifen, die Zugriff auf die verwendete Azure-Ressource haben. Wenn Sie bereits beschriftete Daten haben, können Sie sie als Grundlage für die ersten Schritte verwenden und ein Projekt importieren.

Language Studio
REST-APIs

Melden Sie sich bei Language Studio an. Es wird ein Fenster angezeigt, in dem Sie Ihr Abonnement und Ihre Sprachressource auswählen können. Wählen Sie die Sprachressource aus, die Sie im Schritt oben erstellt haben.
Wählen Sie im Abschnitt Informationen extrahieren von Language Studio die Option Benutzerdefinierte benannte Entitätserkennung aus.
Wählen Sie im oberen Menü Ihrer Projektseite Neues Projekt erstellen aus. Durch das Erstellen eines Projekts können Sie Daten kennzeichnen sowie Ihre Modelle trainieren, auswerten, verbessern und bereitstellen.
Nachdem Sie auf Neues Projekt erstellen geklickt haben, wird ein Fenster angezeigt, in dem Sie eine Verbindung mit Ihrem Speicherkonto herstellen können. Wenn Sie bereits ein Speicherkonto verbunden haben, wird das verbundene Speicherkonto angezeigt. Falls nicht, wählen Sie Ihr Speicherkonto im angezeigten Dropdownmenü aus, und klicken Sie auf Speicherkonto verbinden. Dadurch werden die erforderlichen Rollen für Ihr Speicherkonto festgelegt. Dieser Schritt gibt möglicherweise einen Fehler zurück, wenn Sie nicht als Besitzer des Speicherkontos zugewiesen sind.
Hinweis
- Sie müssen diesen Schritt nur einmal für jede neue Ressource durchführen, die Sie verwenden.
- Dieser Prozess kann nicht rückgängig gemacht werden – wenn Sie ein Speicherkonto mit Ihrer Sprachressource verbinden, können Sie die Verbindung später nicht trennen.
- Sie können Ihre Sprachressource nur mit einem Speicherkonto verbinden.
Geben Sie die Projektinformationen ein, einschließlich eines Namens, einer Beschreibung und der Sprache der Dateien in Ihrem Projekt. Wenn Sie das Beispieldataset verwenden, wählen Sie Englisch aus. Sie können den Namen Ihres Projekts später nicht mehr ändern. Wählen Sie Weiter aus.

Tipp

Ihr Dataset muss nicht zur Gänze in derselben Sprache vorliegen. Sie können mehrere Dokumente verwenden, jedes mit jeweils anderen unterstützten Sprachen. Wenn Ihr Dataset Dokumente in verschiedenen Sprachen enthält oder Sie zur Laufzeit mit Text mit verschiedenen Sprachen rechnen, wählen Sie die Option Mehrsprachiges Dataset aktivieren aus, wenn Sie die grundlegenden Informationen für Ihr Projekt eingeben. Diese Option kann später auf der Seite Projekteinstellungen aktiviert werden.
Wählen Sie den Container aus, in den Sie Ihr Dataset hochgeladen haben. Wenn Sie die Daten bereits beschriftet haben, stellen Sie sicher, dass sie dem unterstützten Format entsprechen, und wählen Sie Ja, meine Dateien sind bereits beschriftet, und ich habe die JSON-Bezeichnungsdatei formatiert aus. Wählen Sie die Bezeichnungsdatei im Dropdownmenü aus. Wählen Sie Weiter aus.
Überprüfen Sie die eingegebenen Daten, und wählen Sie Projekt erstellen aus.

Um mit der Erstellung eines benutzerdefinierten Entitätserkennungsmodells zu beginnen, müssen Sie ein Projekt erstellen. Durch das Erstellen eines Projekts können Sie Daten bezeichnen sowie Ihre Modelle trainieren, auswerten, verbessern und bereitstellen.

Hinweis

Beim Projektnamen wird bei allen Vorgängen die Groß-/Kleinschreibung beachtet.

Erstellen Sie eine PATCH-Anforderung mithilfe der folgenden URL, Header und des JSON-Texts, um Ihr Projekt zu erstellen.

Anforderungs-URL

Verwenden Sie die folgende URL, um ein Projekt zu erstellen. Ersetzen Sie die folgenden Platzhalter durch Ihre eigenen Werte.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}?api-version={API-VERSION}

Platzhalter	Wert	Beispiel
`{ENDPOINT}`	Der Endpunkt für die Authentifizierung Ihrer API-Anforderung.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Der Name für Ihr Projekt. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.	`myProject`
`{API-VERSION}`	Die Version der von Ihnen aufgerufenen API. Der hier referenzierte Wert gilt für die neueste veröffentlichte Version. Weitere Informationen zu anderen verfügbaren API-Versionen finden Sie unter Modelllebenszyklus.	`2022-05-01`

Header

Verwenden Sie den folgenden Header, um Ihre Anforderung zu authentifizieren.

Schlüssel	Wert
`Ocp-Apim-Subscription-Key`	Der Schlüssel für Ihre Ressource. Wird für die Authentifizierung Ihrer API-Anforderungen verwendet.

Body

Verwenden Sie den folgenden JSON-Code in Ihrer Anforderung. Ersetzen Sie die folgenden Platzhalter durch Ihre eigenen Werte.

{
  "projectName": "{PROJECT-NAME}",
  "language": "{LANGUAGE-CODE}",
  "projectKind": "CustomEntityRecognition",
  "description": "Project description",
  "multilingual": "True",
  "storageInputContainerName": "{CONTAINER-NAME}"
}

Schlüssel	Platzhalter	Wert	Beispiel
projectName	`{PROJECT-NAME}`	Der Name des Projekts. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.	`myProject`
language	`{LANGUAGE-CODE}`	Eine Zeichenfolge, die den Sprachcode für die in Ihrem Projekt verwendeten Dokumente angibt. Wählen Sie bei einem mehrsprachigen Projekt den Sprachcode für die Sprache aus, die in den meisten der Dokumente verwendet wird. Weitere Informationen zu unterstützten Sprachcodes finden Sie unter Sprachunterstützung.	`en-us`
projectKind	`CustomEntityRecognition`	Die Art Ihres Projekts	`CustomEntityRecognition`
multilingual	`true`	Ein boolescher Wert, der es ermöglicht, dass Ihr Dataset Dokumente in mehreren Sprachen enthält. Wenn Ihr Modell bereitgestellt wird, können Sie das Modell in jeder unterstützten Sprache abfragen (nicht unbedingt in Ihren Trainingsdokumenten enthalten). Informationen zur Unterstützung mehrerer Sprachen finden Sie unter Sprachunterstützung.	`true`
storageInputContainerName	`{CONTAINER-NAME`	Dies ist der Name Ihres Azure-Speichercontainers, in dem Sie Ihre Dokumente hochgeladen haben.	`myContainer`

Diese Anforderung gibt die Antwort 201 zurück, was bedeutet, dass das Projekt erstellt wurde.

Diese Anforderung gibt in diesem Fall einen Fehler zurück:

Die ausgewählte Ressource verfügt nicht über die richtige Berechtigung für das Speicherkonto.

Importieren des Projekts

Wenn Sie bereits beschriftete Daten haben, können Sie sie verwenden, um mit dem Dienst zu beginnen. Achten Sie darauf, dass Ihre Daten dem akzeptierten Datenformat entsprechen.

Language Studio
REST-APIs

Melden Sie sich bei Language Studio an. Es wird ein Fenster angezeigt, in dem Sie Ihr Abonnement und Ihre Sprachressource auswählen können. Wählen Sie Ihre Sprachressource aus.
Wählen Sie im Abschnitt Informationen extrahieren von Language Studio die Option Benutzerdefinierte benannte Entitätserkennung aus.
Wählen Sie im oberen Menü Ihrer Projektseite Neues Projekt erstellen aus. Durch das Erstellen eines Projekts können Sie Daten kennzeichnen sowie Ihre Modelle trainieren, auswerten, verbessern und bereitstellen.
Nachdem Sie Neues Projekt erstellen ausgewählt haben,wird ein Bildschirm angezeigt, auf dem Sie eine Verbindung mit Ihrem Speicherkonto herstellen können. Wenn Sie Ihr Speicherkonto nicht finden können, vergewissern Sie sich, dass Sie beim Erstellen der Ressource die empfohlenen Schritte durchgeführt haben. Wenn Sie bereits ein Speicherkonto mit Ihrer Sprachressource verbunden haben, wird Ihr verbundenes Speicherkonto angezeigt.
Hinweis
- Sie müssen diesen Schritt nur einmal für jede neue Sprachressource durchführen, die Sie verwenden.
- Dieser Prozess kann nicht rückgängig gemacht werden – wenn Sie ein Speicherkonto mit Ihrer Sprachressource verbinden, können Sie die Verbindung später nicht trennen.
- Sie können Ihre Sprachressource nur mit einem Speicherkonto verbinden.
Geben Sie die Projektinformationen ein, einschließlich eines Namens, einer Beschreibung und der Sprache der Dateien in Ihrem Projekt. Sie können den Namen Ihres Projekts später nicht mehr ändern. Wählen Sie Weiter aus.

Tipp

Ihr Dataset muss nicht zur Gänze in derselben Sprache vorliegen. Sie können mehrere Dokumente verwenden, jedes mit jeweils anderen unterstützten Sprachen. Wenn Ihr Dataset Dokumente in verschiedenen Sprachen enthält oder Sie zur Laufzeit mit Text mit verschiedenen Sprachen rechnen, wählen Sie die Option Mehrsprachiges Dataset aktivieren aus, wenn Sie die grundlegenden Informationen für Ihr Projekt eingeben. Diese Option kann später auf der Seite Projekteinstellungen aktiviert werden.
Wählen Sie den Container aus, in den Sie Ihr Dataset hochgeladen haben.
Klicken Sie auf Ja, meine Dateien sind bereits beschriftet, und ich habe die JSON-Bezeichnungsdatei formatiert., und wählen Sie die Bezeichnungsdatei im unten angegebenen Dropdownmenü aus, um Ihre Datei mit JSON-Tags zu importieren. Achten Sie darauf, dass sie dem unterstützten Format entspricht.
Wählen Sie Weiter aus.
Überprüfen Sie die eingegebenen Daten, und wählen Sie Projekt erstellen aus.

Übermitteln Sie eine POST-Anforderung mithilfe der folgenden URL, der Header und des JSON-Texts, um Ihre Bezeichnungsdatei zu importieren. Stellen Sie sicher, dass die Bezeichnungsdatei dem akzeptierten Format entspricht.

Wenn bereits ein Projekt mit demselben Namen existiert, werden die Daten dieses Projekts ersetzt.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}/:import?api-version={API-VERSION}

Platzhalter	Wert	Beispiel
`{ENDPOINT}`	Der Endpunkt für die Authentifizierung Ihrer API-Anforderung.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Der Name für Ihr Projekt. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.	`myProject`
`{API-VERSION}`	Die Version der von Ihnen aufgerufenen API. Der hier referenzierte Wert gilt für die neueste veröffentlichte Version. Weitere Informationen zu anderen verfügbaren API-Versionen finden Sie unter Modelllebenszyklus.	`2022-05-01`

Header

Verwenden Sie den folgenden Header, um Ihre Anforderung zu authentifizieren.

Schlüssel	Wert
`Ocp-Apim-Subscription-Key`	Der Schlüssel für Ihre Ressource. Wird für die Authentifizierung Ihrer API-Anforderungen verwendet.

Body

Verwenden Sie den folgenden JSON-Code in Ihrer Anforderung. Ersetzen Sie die folgenden Platzhalter durch Ihre eigenen Werte.

{
    "projectFileVersion": "{API-VERSION}",
    "stringIndexType": "Utf16CodeUnit",
    "metadata": {
        "projectName": "{PROJECT-NAME}",
        "projectKind": "CustomEntityRecognition",
        "description": "Trying out custom NER",
        "language": "{LANGUAGE-CODE}",
        "multilingual": true,
        "storageInputContainerName": "{CONTAINER-NAME}",
        "settings": {}
    },
    "assets": {
    "projectKind": "CustomEntityRecognition",
        "entities": [
            {
                "category": "Entity1"
            },
            {
                "category": "Entity2"
            }
        ],
        "documents": [
            {
                "location": "{DOCUMENT-NAME}",
                "language": "{LANGUAGE-CODE}",
                "dataset": "{DATASET}",
                "entities": [
                    {
                        "regionOffset": 0,
                        "regionLength": 500,
                        "labels": [
                            {
                                "category": "Entity1",
                                "offset": 25,
                                "length": 10
                            },
                            {
                                "category": "Entity2",
                                "offset": 120,
                                "length": 8
                            }
                        ]
                    }
                ]
            },
            {
                "location": "{DOCUMENT-NAME}",
                "language": "{LANGUAGE-CODE}",
                "dataset": "{DATASET}",
                "entities": [
                    {
                        "regionOffset": 0,
                        "regionLength": 100,
                        "labels": [
                            {
                                "category": "Entity2",
                                "offset": 20,
                                "length": 5
                            }
                        ]
                    }
                ]
            }
        ]
    }
}

Schlüssel	Platzhalter	Wert	Beispiel
`api-version`	`{API-VERSION}`	Die Version der von Ihnen aufgerufenen API. Die hier verwendete Version muss mit der API-Version in der URL identisch sein. Weitere Informationen zu anderen verfügbaren API-Versionen finden Sie hier.	`2022-03-01-preview`
`projectName`	`{PROJECT-NAME}`	Der Name des Projekts. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.	`myProject`
`projectKind`	`CustomEntityRecognition`	Die Art Ihres Projekts	`CustomEntityRecognition`
`language`	`{LANGUAGE-CODE}`	Eine Zeichenfolge, die den Sprachcode für die in Ihrem Projekt verwendeten Dokumente angibt. Wählen Sie bei einem mehrsprachigen Projekt den Sprachcode für die Sprache aus, die in den meisten der Dokumente verwendet wird.	`en-us`
`multilingual`	`true`	Ein boolescher Wert, der es ermöglicht, dass Ihr Dataset Dokumente in mehreren Sprachen enthält. Wenn Ihr Modell bereitgestellt wird, können Sie das Modell in jeder unterstützten Sprache abfragen (nicht unbedingt in Ihren Trainingsdokumenten enthalten). Weitere Informationen zur Unterstützung mehrerer Sprachen finden Sie unter Sprachunterstützung.	`true`
`storageInputContainerName`	{CONTAINER-NAME}	Der Name Ihres Azure-Speichercontainers, in den Sie Ihre Dokumente hochgeladen haben	`myContainer`
`entities`		Dies ist ein Array mit allen Entitätstypen, die im Projekt enthalten sind. Dies sind die Entitätstypen, die aus Ihren Dokumenten extrahiert werden.
`documents`		Dies ist ein Array mit allen Dokumenten in Ihrem Projekt und die Liste der Entitäten, die innerhalb jedes Dokuments gekennzeichnet sind.	[]
`location`	`{DOCUMENT-NAME}`	Dies ist der Speicherort der Dokumente im Speichercontainer. Da sich alle Dokumente im Stammverzeichnis des Containers befinden, sollte dies der Dokumentname sein.	`doc1.txt`
`dataset`	`{DATASET}`	Dies ist der Testsatz, in den diese Datei bei der Aufteilung vor dem Training aufgenommen wird. Weitere Informationen darüber, wie Ihre Daten geteilt werden, finden Sie unter Trainieren eines Modells. Mögliche Werte für dieses Feld sind `Train` und `Test`.	`Train`

Nachdem Sie Ihre API-Anforderung gesendet haben, erhalten Sie eine Antwort vom Typ 202, die angibt, dass der Auftrag ordnungsgemäß übermittelt wurde. Extrahieren Sie in den Antwortheadern den operation-location-Wert. Er weist das folgende Format auf:

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/import/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} wird verwendet, um Ihre Anforderung zu identifizieren, da es sich um einen asynchronen Vorgang handelt. Sie verwenden diese URL, um den Status des Importauftrags abzurufen.

Mögliche Fehlerszenarios für diese Anforderung:

Die ausgewählte Ressource verfügt nicht über die richtigen Berechtigungen für das Speicherkonto.
Das angegebene storageInputContainerName-Element ist nicht vorhanden.
Ein ungültiger Sprachcode wird verwendet, oder der Sprachcodetyp ist keine Zeichenfolge.
Der Wert multilingual ist eine Zeichenfolge und kein boolescher Wert.

Navigieren Sie in Language Studio zur Seite mit den Projekteinstellungen.
Sie können Projektdetails anzeigen.
Auf dieser Seite können Sie in den Projekteinstellungen die Projektbeschreibung aktualisieren und das mehrsprachige Dataset aktivieren/deaktivieren.
Sie können auch das verbundene Speicherkonto und den Container Ihrer Sprachressource anzeigen.
Außerdem können Sie auf dieser Seite den primären Ressourcenschlüssel abrufen.

Verwenden Sie die folgende GET-Anforderung, um Ihre Projektdetails abzurufen. Ersetzen Sie die folgenden Platzhalter durch Ihre eigenen Werte.

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}?api-version={API-VERSION}

Platzhalter	Wert	Beispiel
`{ENDPOINT}`	Der Endpunkt für die Authentifizierung Ihrer API-Anforderung.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Der Name für Ihr Projekt. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.	`myProject`
`{API-VERSION}`	Die Version der von Ihnen aufgerufenen API. Weitere Informationen zu anderen verfügbaren API-Versionen finden Sie unter Modelllebenszyklus.	`2022-05-01`

Header

Verwenden Sie den folgenden Header, um Ihre Anforderung zu authentifizieren.

Schlüssel	Wert
`Ocp-Apim-Subscription-Key`	Der Schlüssel für Ihre Ressource. Wird für die Authentifizierung Ihrer API-Anforderungen verwendet.

Antworttext

    {
        "createdDateTime": "2021-10-19T23:24:41.572Z",
        "lastModifiedDateTime": "2021-10-19T23:24:41.572Z",
        "lastTrainedDateTime": "2021-10-19T23:24:41.572Z",
        "lastDeployedDateTime": "2021-10-19T23:24:41.572Z",
        "projectKind": "CustomEntityRecognition",
        "storageInputContainerName": "{CONTAINER-NAME}",
        "projectName": "{PROJECT-NAME}",
        "multilingual": false,
        "description": "Project description",
        "language": "{LANGUAGE-CODE}"
    }

Wert	Platzhalter	Beschreibung	Beispiel
`projectKind`	`CustomEntityRecognition`	Die Art Ihres Projekts	`CustomEntityRecognition`
`storageInputContainerName`	`{CONTAINER-NAME}`	Der Name Ihres Azure-Speichercontainers, in den Sie Ihre Dokumente hochgeladen haben	`myContainer`
`projectName`	`{PROJECT-NAME}`	Der Name des Projekts. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.	`myProject`
`multilingual`	`true`	Ein boolescher Wert, der es ermöglicht, dass Ihr Dataset Dokumente in mehreren Sprachen enthält. Wenn Ihr Modell bereitgestellt wird, können Sie das Modell in jeder unterstützten Sprache abfragen (nicht unbedingt in Ihren Trainingsdokumenten enthalten). Weitere Informationen zur Unterstützung mehrerer Sprachen finden Sie unter Sprachunterstützung.	`true`
`language`	`{LANGUAGE-CODE}`	Eine Zeichenfolge, die den Sprachcode für die in Ihrem Projekt verwendeten Dokumente angibt. Wählen Sie bei einem mehrsprachigen Projekt den Sprachcode für die Sprache aus, die in den meisten der Dokumente verwendet wird.	`en-us`

Nachdem Sie Ihre API-Anforderung gesendet haben, erhalten Sie eine Antwort vom Typ 200, die angibt, dass die Anforderung erfolgreich war, sowie den JSON-Antworttext mit Ihren Projektdetails.

Löschen eines Projekts

Language Studio
REST-APIs

Wenn Sie Ihr Projekt nicht mehr benötigen, können Sie das Projekt mithilfe von Language Studio löschen. Wählen Sie oben Benutzerdefinierte Erkennung benannter Entitäten (NER) und das zu löschende Projekt und dann im oberen Menü Löschen aus.

Wenn Sie Ihr Projekt nicht mehr benötigen, können Sie es mit der folgenden DELETE-Anforderung löschen. Ersetzen Sie die Platzhalterwerte durch eigene Werte.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}?api-version={API-VERSION}

Platzhalter	Wert	Beispiel
`{ENDPOINT}`	Der Endpunkt für die Authentifizierung Ihrer API-Anforderung.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Der Name für Ihr Projekt. Bei diesem Wert wird die Groß-/Kleinschreibung beachtet.	`myProject`
`{API-VERSION}`	Die Version der von Ihnen aufgerufenen API. Der hier referenzierte Wert gilt für die neueste veröffentlichte Version. Weitere Informationen zu anderen verfügbaren API-Versionen finden Sie unter Modelllebenszyklus.	`2022-05-01`

Header

Verwenden Sie den folgenden Header, um Ihre Anforderung zu authentifizieren.

Schlüssel	Wert
Ocp-Apim-Subscription-Key	Der Schlüssel für Ihre Ressource. Wird für die Authentifizierung Ihrer API-Anforderungen verwendet.

Nachdem Sie Ihre API-Anforderung gesendet haben, erhalten Sie eine Antwort vom Typ 202, die anzeigt, dass Ihr Projekt erfolgreich gelöscht wurde. Ein erfolgreicher Aufruf enthält einen Operation-Location-Header, mit dem der Auftragsstatus überprüft wird.

Nächste Schritte

Sie sollten eine Vorstellung von dem Projektschema haben, das Sie zum Bezeichnen Ihrer Daten verwenden werden.
Nachdem das Projekt erstellt wurde, können Sie mit dem Bezeichnen Ihrer Daten beginnen, wodurch Ihr Entitätsextraktionsmodell darüber informiert wird, wie Text interpretiert wird, und für das Training und die Auswertung verwendet wird.

Erstellen eines Projekts für benutzerdefinierte NER

Voraussetzungen

Erstellen einer Language-Ressource

Erstellen von Sprachressourcen und Verbinden eines Speicherkontos

Erstellen einer neuen Ressource im Azure-Portal

Erstellen einer neuen Sprachressource über Language Studio

Erstellen einer neuen Sprachressource mithilfe von PowerShell

Verwenden einer bereits vorhandenen Sprachressource

Aktivieren der Identitätsverwaltung für Ihre Ressource

Aktivieren des Features „Benutzerdefinierte benannte Entitätserkennung“

Hinzufügen erforderlicher Rollen

Rollen für Ihre Azure KI Language-Ressource

Rollen für Ihr Speicherkonto

Aktivieren von CORS für Ihr Speicherkonto

Erstellen eines benutzerdefinierten Projekts zur Erkennung benannter Entitäten

Importieren des Projekts

Abrufen von Projektdetails

Löschen eines Projekts

Nächste Schritte

Zusätzliche Ressourcen