Megosztás a következőn keresztül:


Kulcskifejezések kinyerása szövegből

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Kinyeri a kulcskifejezéseket egy adott szövegből

Kategória: Text Analytics

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a key phrases from Text (Kulcskifejezések kinyerása szövegből) modul a Machine Learning Studio (klasszikus) használatával egy szöveges oszlop előzetes feldolgozásához. A természetes nyelvű szövegeket tartalmazó oszlopban a modul kinyer egy vagy több kifejező kifejezést. A kifejezések lehetnek egyetlen szó, egy összetett főnév vagy egy módosító plusz egy főnév.

Ez a modul a kulcskifejezések kinyerése céljából használt természetes nyelvi feldolgozási API-k burkolója. A kifejezések elemzése a mondat kontextusában több okból is értelmezhető lehet:

  • A kifejezés rögzíti a mondat témáját.
  • A kifejezés módosító és főnév kombinációját tartalmazza, amely hangulatra utal.

Tegyük fel például, hogy az elemzett mondat a következő: "Nagyszerű szálloda volt, hogy egyedi barátságos és barátságos személyzettel rendelkezik."

A Extract Key Phrases from Text (Kulcskifejezések kinyerása szövegből) modul a következő kulcskifejezéseket adja vissza:

  • nagyszerű szálloda
  • felhasználóbarát személyzet
  • egyedi egyedi

Kulcskifejezések kinyerása szövegből konfigurálása

A kulcskifejezések kinyeréhez csatlakoztatnia kell egy szöveges oszlopot tartalmazó adatkészletet.

  1. Adja hozzá a Key Phrases kinyerés szövegből modult a Machine Learning Studióban (klasszikus). Ezután kösse össze azt az adatkészletet, amely legalább egy teljes szöveges oszloppal rendelkezik.

  2. Az Oszlopválasztóval válassza ki a sztring típusú oszlopot, amelyből kulcskifejezéseket fog kinyerni.

  3. A Nyelv mezőben válassza ki a kifejezések elemzésekor használni kívánt nyelvet. Ha megad egy nyelvet, a kimenet csak a célnyelven megadott kifejezéseket fogja megadni.

  4. Ha a szöveges oszlop több nyelven tartalmaz kifejezéseket, válassza az oszlopokban azonosított nyelv lehetőséget. Megjelenik egy új oszlopválasztó, amely lehetővé teszi egy nyelvi azonosítót tartalmazó oszlop kiválasztását az adatkészletben. A nyelvazonosító lehet a nyelv neve vagy az Iso6391 kulturális környezet azonosítója. Az "English" vagy az "en" például elfogadható.

    Tipp

    Mielőtt futtatja a Extract Key Phrases from Text (Kulcskifejezések kinyerása szövegből) modult, a Detect Languages (Nyelvek felismerése) modullal azonosítsa az egyes sorok nyelvét, és hozza létre az azonosítót. Hiba történik, ha a nyelvazonosító oszlop olyan nyelveket tartalmaz, amelyek nem támogatottak a Kulcskifejezések kinyerása szövegből.

Results (Eredmények)

A modul kimenete egy vesszővel elválasztott kulcskifejezéseket tartalmazó adatkészlet.

Az alábbi példaeredmények például egy olyan bemeneti adatkészletre mutatnak, amely több nyelven tartalmaz felülvizsgálatokat:

Kulcskifejezések
novel,című könyv,jó könyv,adventure story,avalanche of events,good characters
primer misterio,personajes,fan,aventura,isla
  • Minden kimeneti kifejezés egyetlen oszlopban található; nem ad át más oszlopot, és nem ad hozzá azonosítót. Ha azonban a kimeneti kifejezéseket a forrásszöveghez szeretné igazítani, a kimeneti kifejezéseket újraegyesheti a bemenettel az Oszlopok hozzáadása modullal .

  • A kulcskifejezések kinyerése nem jelzi az egyes kifejezések nyelvét.

  • Ha olyan nyelvet tartalmaz, amelyet a Kulcskifejezések kinyerása modul nem támogat, a rendszer hibát jelez (0039). A hibák elkerülése érdekében mindenképpen szűrje ki a nem kompatibilis nyelvi azonosítóval rendelkezik bemeneti szöveget.

    Ha kevés sor áll rendelkezésre más nyelvekből, elkerülheti a hibát, ha kihagyja a nyelvazonosítót, és egyetlen nyelv kiválasztásával elemzi az összes szöveget. Ha azonban így történik, az eredmények nagyon rosszak, mert a többi nyelvben a teljes mondatok egyetlen kulcskifejezésként lesznek kihozva.

Példák

A következő példa bemutatja, hogyan használható ez a modul kulcskifejezések kinyerására, majd szófelhők nyerését a kifejezésekből: Kulcskifejezések kinyerása és a Szófelhő megjelenítése

A Azure AI Gallery használatával történő szövegfeldolgozás további példáiért tekintse meg a Machine Learning.

Technikai megjegyzések

Ez a modul jelenleg a következő nyelveket támogatja:

  • Holland
  • Angol
  • Francia
  • Német
  • Olasz
  • Spanyol

További nyelvek esetén fontolja meg a Text Analytics API használatát a Azure Cognitive Services. További információ: Kulcskifejezések kinyerása a Text Analytics

Várt bemenetek

Név Típus Description
Adathalmaz Adattábla A feldolgozható szöveget tartalmazó tábla.

Modulparaméterek

Név Típus Tartomány Választható Alapértelmezett Description
Kulturális környezet oszlop ColumnSelection (Oszlopválasztás) language:Az oszlop nyelvet tartalmaz A kulturális nyelv adatait tartalmazó oszlop neve vagy egyalapú indexe
Szöveges oszlop ColumnSelection (Oszlopválasztás) Kötelező A szöveges oszlop neve vagy egyalapú indexe.
Nyelv T_Language Angol, spanyol, francia, holland, német, olasz, oszlop tartalmazza a nyelvet Kötelező Angol Válassza ki a feldolgozni kívánt szöveg nyelvét.

Kimenetek

Név Típus Description
Eredményadatkészlet Adattábla A kinyert kulcskifejezések

Kivételek

Kivétel Description
0003-as hiba Kivétel akkor fordul elő, ha egy vagy több bemenet null vagy üres.
0010-es hiba Kivétel akkor fordul elő, ha a bemeneti adatkészletek oszlopnevének egyeznie kell, de nem.
0016-os hiba Kivétel akkor fordul elő, ha a modulnak átadott bemeneti adatkészletek kompatibilis oszloptípusokkal, de nem.
0008-as hiba Kivétel akkor fordul elő, ha a paraméter nem a tartományon belül van.

A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.

Az API-kivételek listáját a hibakódok Machine Learning REST API.

Lásd még

Text Analytics
A-Z modullista