Cognitieve vaardigheid sleuteltermextractie

Artikel
09/01/2024

De vaardigheid Sleuteltermextractie evalueert ongestructureerde tekst en retourneert voor elke record een lijst met sleuteltermen. Deze vaardigheid maakt gebruik van de Key Phrase Machine Learning-modellen die worden geleverd door Azure AI Language.

Deze mogelijkheid is handig als u snel de belangrijkste gesprekspunten in de record moet identificeren. Bijvoorbeeld, gegeven invoertekst "Het eten was heerlijk en er was geweldig personeel", retourneert de service "eten" en "geweldig personeel".

Notitie

Deze vaardigheid is gebonden aan Azure AI-services en vereist een factureerbare resource voor transacties die groter zijn dan 20 documenten per indexeerfunctie per dag. Voor de uitvoering van ingebouwde vaardigheden worden kosten in rekening gebracht voor de bestaande betalen per gebruik-prijs van Azure AI-services.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

Gegevenslimieten

De maximale grootte van een record moet 50.000 tekens zijn, zoals gemeten door String.Length. Als u uw gegevens wilt opsplitsen voordat u deze naar de sleuteltermextractor verzendt, kunt u overwegen de vaardigheid Tekst splitsen te gebruiken. Als u een vaardigheid voor tekstsplitsing gebruikt, stelt u de paginalengte in op 5000 voor de beste prestaties.

Vaardigheidsparameters

Parameters zijn hoofdlettergevoelig.

Invoerwaarden	Beschrijving
`defaultLanguageCode`	(Optioneel) De taalcode die moet worden toegepast op documenten die niet expliciet taal opgeven. Als de standaardtaalcode niet is opgegeven, wordt Engels (en) gebruikt als de standaardtaalcode. Zie de volledige lijst met ondersteunde talen.
`maxKeyPhraseCount`	(Optioneel) Het maximum aantal sleuteltermen dat moet worden geproduceerd.
`modelVersion`	(Optioneel) Hiermee geeft u de versie van het model op die moet worden gebruikt bij het aanroepen van de sleutelterm-API. Deze wordt standaard ingesteld op de meest recente versie wanneer deze niet is opgegeven. U wordt aangeraden deze waarde niet op te geven, tenzij dit nodig is.

Invoer van vaardigheden

Invoer	Beschrijving
`text`	De te analyseren tekst.
`languageCode`	Een tekenreeks die de taal van de records aangeeft. Als deze parameter niet is opgegeven, wordt de standaardtaalcode gebruikt om de records te analyseren. Zie de volledige lijst met ondersteunde talen.

Uitvoer van vaardigheden

Uitvoer	Beschrijving
`keyPhrases`	Een lijst met sleuteltermen die zijn geëxtraheerd uit de invoertekst. De sleuteltermen worden geretourneerd in volgorde van belang.

Voorbeelddefinitie

Overweeg een SQL-record met de volgende velden:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

Uw vaardigheidsdefinitie ziet er dan als volgt uit:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Voorbeelduitvoer

In het vorige voorbeeld wordt de uitvoer van uw vaardigheid geschreven naar een nieuw knooppunt in de verrijkte boomstructuur met de naam 'document/myKeyPhrases', omdat dat het targetName opgegeven is. Als u geen waarde targetNameopgeeft, is dit 'document/keyPhrases'.

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

U kunt 'document/myKeyPhrases' gebruiken als invoer in andere vaardigheden of als bron van een uitvoerveldtoewijzing.

Waarschuwingen

Als u een niet-ondersteunde taalcode opgeeft, wordt er een waarschuwing gegenereerd en worden sleuteltermen niet geëxtraheerd. Als uw tekst leeg is, wordt er een waarschuwing gegenereerd. Als uw tekst groter is dan 50.000 tekens, worden alleen de eerste 50.000 tekens geanalyseerd en wordt er een waarschuwing weergegeven.

Delen via