Der kognitive Skill „Erkennung benannter Entitäten“ (v2)
Der Skill Erkennung benannter Entitäten (v2) extrahiert benannte Entitäten aus Text. Zu den verfügbaren Entitäten gehören die Typen person
, location
und organization
.
Wichtig
Der Skill Erkennung benannter Entitäten (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) wurde jetzt eingestellt und ersetzt durch Microsoft.Skills.Text.V3.EntityRecognitionSkill. Führen Sie unter Berücksichtigung der Empfehlungen unter Veraltete Azure AI Search Skills eine Migration zu einem unterstützten Skill durch.
Hinweis
Wenn Sie den Umfang erweitern, indem Sie die Verarbeitungsfrequenz erhöhen oder weitere Dokumente oder KI-Algorithmen hinzufügen, müssen Sie eine kostenpflichtige Azure KI Services-Ressource anfügen. Gebühren fallen beim Aufrufen von APIs in Azure AI Services sowie für die Bildextraktion im Rahmen der Dokumentaufschlüsselungsphase in Azure AI Search an. Für die Textextraktion aus Dokumenten fallen keine Gebühren an. Die Ausführung integrierter Skills wird nach dem bestehenden nutzungsbasierten Preis für Azure AI Services berechnet.
Die Bildextraktion ist eine zusätzliche Gebühr, die durch Azure AI Search berechnet wird, wie auf der Seite mit der Preisübersicht beschrieben. Die Textextraktion ist kostenlos.
@odata.type
Microsoft.Skills.Text.NamedEntityRecognitionSkill
Datengrenzwerte
Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length
). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an die Schlüsselbegriffserkennung senden, denken Sie daran, den Skill „Text teilen“ zu verwenden. Wenn Sie einen Textteilungsskill verwenden, legen Sie die Seitenlänge auf 5000 fest, um die beste Leistung zu erzielen.
Skillparameter
Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.
Parametername | Beschreibung |
---|---|
categories | Array von zu extrahierenden Kategorien. Mögliche Kategorietypen: "Person" , "Location" , "Organization" . Wenn keine Kategorie angegeben ist, werden alle Typen zurückgegeben. |
defaultLanguageCode | Sprachcode des Eingabetexts. Die folgenden Sprachen werden unterstützt: de, en, es, fr, it |
minimumPrecision | Eine Zahl zwischen 0 und 1. Wenn die Genauigkeit unter diesem Wert liegt, wird die Entität nicht zurückgegeben. Der Standardwert ist 0. |
Skilleingaben
Eingabename | Beschreibung |
---|---|
languageCode | Optional. Der Standardwert ist "en" . |
text | Der zu analysierende Text |
Skillausgaben
Ausgabename | Beschreibung |
---|---|
persons | Ein Array von Zeichenfolgen, wobei jede Zeichenfolge den Namen einer Person darstellt. |
locations | Ein Array von Zeichenfolgen, wobei jede Zeichenfolge einen Ort darstellt. |
Organisationen | Ein Array von Zeichenfolgen, wobei jede Zeichenfolge eine Organisation darstellt. |
entities | Ein Array komplexer Typen. Jeder komplexe Typ umfasst die folgenden Felder:
|
Beispieldefinition
{
"@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
"categories": [ "Person", "Location", "Organization"],
"defaultLanguageCode": "en",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "persons",
"targetName": "people"
}
]
}
Beispieleingabe
{
"values": [
{
"recordId": "1",
"data":
{
"text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
"languageCode": "en"
}
}
]
}
Beispielausgabe
{
"values": [
{
"recordId": "1",
"data" :
{
"persons": [ "Joe Romero", "Ana Smith"],
"locations": ["Chile", "Australia"],
"organizations":["Microsoft"],
"entities":
[
{
"category":"person",
"value": "Joe Romero",
"offset": 33,
"confidence": 0.87
},
{
"category":"person",
"value": "Ana Smith",
"offset": 124,
"confidence": 0.87
},
{
"category":"location",
"value": "Chile",
"offset": 88,
"confidence": 0.99
},
{
"category":"location",
"value": "Australia",
"offset": 112,
"confidence": 0.99
},
{
"category":"organization",
"value": "Microsoft",
"offset": 54,
"confidence": 0.99
}
]
}
}
]
}
Warnungsfälle
Wird der Sprachcode für das Dokument nicht unterstützt, wird eine Warnung zurückgegeben, und es werden keine Entitäten extrahiert.