Der kognitive Skill „Schlüsselbegriffserkennung“

Der Skill Schlüsselbegriffserkennung bewertet unstrukturierten Text und gibt für jeden Datensatz eine Liste mit Schlüsselbegriffen zurück. Dieser Skill verwendet die Key Phrase Machine Learning-Modelle, die von Azure KI Language bereitgestellt werden.

Diese Funktion ist nützlich, wenn Sie die wichtigsten Gesprächspunkte in dem Datensatz schnell identifizieren müssen. Zum Beispiel, wenn der eingegebene Text „Das Essen war köstlich, und es gab hervorragendes Personal“ lautet, gibt der Dienst „Essen“ und „hervorragendes Personal“ zurück.

Hinweis

Dieser Skill ist an Azure KI Services gebunden und erfordert eine abrechenbare Ressource für Transaktionen, die 20 Dokumente pro Indexer und Tag überschreiten. Die Ausführung integrierter Skills wird nach dem bestehenden nutzungsbasierten Preis für Azure KI Services berechnet.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

Datengrenzwerte

Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an die Schlüsselbegriffserkennung senden, denken Sie daran, den Skill „Text teilen“ zu verwenden. Wenn Sie einen Textteilungsskill verwenden, legen Sie die Seitenlänge auf 5000 fest, um die beste Leistung zu erzielen.

Skillparameter

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.

Eingaben Beschreibung
defaultLanguageCode (Optional) Der Sprachcode, der auf Dokumente angewendet wird, in denen die Sprache nicht explizit angegeben ist. Wenn kein Standardsprachcode festgelegt ist, wird Englisch (en) als Standardsprachcode verwendet.
Siehe die vollständige Liste der unterstützten Sprachen.
maxKeyPhraseCount (Optional) Die maximale Anzahl der Schlüsselbegriffe, die erzeugt werden.
modelVersion (Optional) Gibt die Version des Modells an, die beim Aufruf der Schlüsselbegriffs-API verwendet wird. Es wird standardmäßig die neueste verfügbare Version verwendet. Es wird empfohlen, diesen Wert nur anzugeben, wenn es notwendig ist.

Skilleingaben

Eingabe Beschreibung
text Der zu analysierende Text
languageCode Eine Zeichenfolge, die die Sprache der Datensätze angibt. Wenn dieser Parameter nicht angegeben ist, wird der Standardsprachcode zur Analyse der Datensätze verwendet.
Siehe die vollständige Liste der unterstützten Sprachen.

Skillausgaben

Ausgabe Beschreibung
keyPhrases Eine Liste mit aus dem Eingabetext extrahierten Schlüsselausdrücken. Die Schlüsselausdrücke werden in der Reihenfolge ihrer Wichtigkeit zurückgegeben.

Beispieldefinition

Gehen Sie von einem SQL-Datensatz mit den folgenden Feldern aus:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

Ihre Skilldefinition sieht dann möglicherweise folgendermaßen aus:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Beispielausgabe

Im vorherigen Beispiel wird die Ausgabe Ihres Skills in einen neuen Knoten in der angereicherten Informationsstruktur namens „document/myKeyPhrases“ geschrieben, da dies der angegebene Wert für targetName ist. Wenn Sie keinen Wert für targetName angeben, wird „document/keyPhrases“ verwendet.

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

Sie können „document/myKeyPhrase“ als Eingabe für andere Skills oder als Quelle für eine Ausgabefeldzuordnung verwenden.

Warnungen

Wenn Sie einen nicht unterstützten Sprachcode bereitstellen, wird eine Warnung generiert, und es werden keine Schlüsselbegriffe extrahiert. Wenn Ihr Text leer ist, wird eine Warnung erstellt. Wenn Ihre Text mehr als 50.000 Zeichen umfasst, werden nur die ersten 50.000 Zeichen analysiert und eine Warnung ausgegeben.

Siehe auch