Share via


Key Phrase Extraction kognitív képesség

A Kulcskifejezések kinyerése képesség strukturálatlan szöveget értékel ki, és minden rekordhoz visszaadja a kulcskifejezések listáját. Ez a képesség az Azure AI Language által biztosított Key Phrase gépi tanulási modelleket használja.

Ez a funkció akkor hasznos, ha gyorsan meg kell határoznia a rekord fő beszédpontjainak adatait. Például a "Az étel finom volt, és csodálatos személyzet volt", a szolgáltatás "ételt" és "csodálatos személyzetet" ad vissza.

Megjegyzés:

Ez a képesség az Azure AI-szolgáltatásokhoz van kötve, és számlázható erőforrást igényel olyan tranzakciókhoz, amelyek indexelőnként naponta 20 dokumentumot meghaladóak. A beépített készségek végrehajtásáért a meglévő Azure AI-szolgáltatások használatalapú fizetéses díját számítjuk fel.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

Adatkorlátok

A rekord maximális méretének 50 000 karakternek kell lennie a mért érték szerint String.Length. Ha fel kell bontania az adatokat, mielőtt elküldené azokat a kulcskifejezés-kinyerőnek, fontolja meg a Szöveg felosztása készség használatát. Ha szöveges felosztási készséget használ, állítsa az oldalhosszt 5000-re a legjobb teljesítmény érdekében.

Képességparaméterek

A paraméterek megkülönböztetik a kis- és nagybetűket.

Inputs Leírás
defaultLanguageCode (Nem kötelező) Azokra a dokumentumokra alkalmazandó nyelvi kód, amelyek nem adják meg explicit módon a nyelvet. Ha nincs megadva az alapértelmezett nyelvi kód, a rendszer az angol (en) nyelvet használja alapértelmezett nyelvkódként.
Tekintse meg a támogatott nyelvek teljes listáját.
maxKeyPhraseCount (Nem kötelező) A létrehozandó kulcskifejezések maximális száma.
modelVersion (Nem kötelező) Megadja a modell azon verzióját, amelyet a kulcskifejezés API-jának meghívásakor használni kell. Ha nincs megadva, alapértelmezés szerint a legújabb elérhető. Javasoljuk, hogy csak akkor adja meg ezt az értéket, ha szükséges.

Készségbemenetek

Bevitel Leírás
text Az elemezni kívánt szöveg.
languageCode A rekordok nyelvét jelző sztring. Ha ez a paraméter nincs megadva, a rendszer az alapértelmezett nyelvi kódot használja a rekordok elemzéséhez.
Tekintse meg a támogatott nyelvek teljes listáját.

Képességkimenetek

Hozam Leírás
keyPhrases A bemeneti szövegből kinyert kulcskifejezések listája. A kulcskifejezések fontossági sorrendben jelennek meg.

Mintadefiníció

Fontolja meg a következő mezőket tartalmazó SQL-rekordot:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

Ezután a képességdefiníció a következőhöz hasonlóan nézhet ki:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

Példakimenet

Az előző példában a képesség kimenete a bővített fa "document/myKeyPhrases" nevű új csomópontjára lesz megírva, mivel ez a targetName megadott érték. Ha nem ad meg egy targetNameértéket, az a "document/keyPhrases" (dokumentum/keyPhrases) lesz.

document/myKeyPhrases

[
  "world’s glaciers", 
  "huge rivers of ice", 
  "Canadian Rockies", 
  "iconic landscapes",
  "Mount Everest region",
  "Continued warming"
]

A "document/myKeyPhrases" más készségek bemeneteként vagy kimeneti mezőleképezés forrásaként is használható.

Warnings

Ha nem támogatott nyelvi kódot ad meg, figyelmeztetés jön létre, és a kulcskifejezések nem lesznek kinyerve. Ha a szöveg üres, figyelmeztetés jön létre. Ha a szöveg 50 000 karakternél nagyobb, a rendszer csak az első 50 000 karaktert elemzi, és figyelmeztetést ad ki.

Kapcsolódó információk