Kognitiv skicklighet för extrahering av nyckelfraser
Skickligheten extrahering av nyckelfraser utvärderar ostrukturerad text och returnerar för varje post en lista med nyckelfraser. Den här färdigheten använder maskininlärningsmodellerna key phrase som tillhandahålls av Azure AI Language.
Den här funktionen är användbar om du snabbt behöver identifiera de viktigaste samtalspunkterna i posten. Till exempel, med tanke på inmatningstexten "Maten var utsökt och det fanns underbar personal", returnerar tjänsten "mat" och "underbar personal".
Kommentar
Den här kompetensen är bunden till Azure AI-tjänster och kräver en fakturerbar resurs för transaktioner som överstiger 20 dokument per indexerare och dag. Körning av inbyggda kunskaper debiteras enligt det befintliga priset för Betala per användning för Azure AI-tjänster.
@odata.type
Microsoft.Skills.Text.KeyPhraseExtractionSkill
Databegränsningar
Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length
. Om du behöver dela upp dina data innan du skickar dem till nyckelfrasextraktorn bör du överväga att använda färdigheten Textdelning. Om du använder en textdelningsfärdighet anger du sidlängden till 5 000 för bästa prestanda.
Kompetensparametrar
Parametrar är skiftlägeskänsliga.
Indata | beskrivning |
---|---|
defaultLanguageCode |
(Valfritt) Språkkoden som ska tillämpas på dokument som inte uttryckligen anger språk. Om standardspråkkoden inte anges används engelska (en) som standardspråkkod. Se den fullständiga listan med språk som stöds. |
maxKeyPhraseCount |
(Valfritt) Det maximala antalet nyckelfraser som ska skapas. |
modelVersion |
(Valfritt) Anger vilken version av modellen som ska användas när nyckelfras-API:et anropas. Den är som standard den senaste tillgängliga när den inte har angetts. Vi rekommenderar att du inte anger det här värdet om det inte är nödvändigt. |
Kunskapsindata
Indata | beskrivning |
---|---|
text |
Texten som ska analyseras. |
languageCode |
En sträng som anger posternas språk. Om den här parametern inte anges används standardspråkkoden för att analysera posterna. Se den fullständiga listan med språk som stöds. |
Kunskapsutdata
Output | beskrivning |
---|---|
keyPhrases |
En lista över nyckelfraser som extraherats från indatatexten. Nyckelfraserna returneras i prioritetsordning. |
Exempeldefinition
Överväg en SQL-post som har följande fält:
{
"content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
"language": "en"
}
Då kan din kompetensdefinition se ut så här:
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/language"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "myKeyPhrases"
}
]
}
Exempelutdata
I föregående exempel skrivs utdata från din färdighet till en ny nod i det berikade trädet med namnet "document/myKeyPhrases" eftersom det är targetName
den som vi har angett. Om du inte anger en targetName
skulle det vara "document/keyPhrases".
document/myKeyPhrases
[
"world’s glaciers",
"huge rivers of ice",
"Canadian Rockies",
"iconic landscapes",
"Mount Everest region",
"Continued warming"
]
Du kan använda "document/myKeyPhrases" som indata till andra kunskaper eller som källa för en mappning av utdatafält.
Varningar
Om du anger en språkkod som inte stöds genereras en varning och nyckelfraser extraheras inte. Om texten är tom genereras en varning. Om texten är större än 50 000 tecken analyseras endast de första 50 000 tecknen och en varning utfärdas.