Text Analytics
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Ez a cikk a Machine Learning Studio (klasszikus) szövegelemzési moduljait ismerteti. Ezek a modulok speciális számítási eszközöket biztosítanak a strukturált és a strukturálatlan szövegekhez, beleértve a következőket:
- Több lehetőség a szöveg előfeldolgozásra.
- Nyelvfelismerés.
- Funkciók létrehozása szövegből testreszabható n-gram szótárak használatával.
- Funkció-kivonatolás, amely hatékonyan elemzi a szöveget előfeldolgozás vagy fejlett nyelvi elemzés nélkül.
- Vowpal Wabbit, a szöveggel való gépi tanulás nagyon gyors elsajátítása érdekében. A Vowpal Wabbit támogatja a funkciók kivonatolását, a témakörmodellezést (LDA) és a besorolást.
- Nevestű entitások felismerése, hogy a strukturálatlan szövegből kinyerhetőek a személyek, helyek és szervezetek nevei.
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
Példák
Példák a szövegelemzésre a Machine Learning: Azure AI Gallery:
Hírek kategorizálása: Funkció-kivonatolással előre definiált kategóriákba sorolja a cikkeket.
Hasonló vállalatok megkeresása: A Wikipedia-cikkek szövegének segítségével kategorizálja a vállalatokat.
Szövegbesorolás: Bemutatja a Twitter-üzenetek szövegének hangulatelemzésben való használatának teljes folyamatát (ötrészes minta).
Modulok listája
A Text Analytics (klasszikus) Machine Learning kategória a következő modulokat tartalmazza:
- Nyelvek felismerése: Felismeri a bemeneti fájl egyes sorai nyelvét.
- Kulcskifejezések kinyerása szövegből: Kinyeri a kulcskifejezéseket az adott szövegből.
- N-Gram-jellemzők kinyerása szövegből: Létrehozza az N-Gram szótár funkcióit, és ki is válogatja őket.
- Funkció kivonatolása: A Vowpal Wabbit kódtár használatával egész szám kódolású funkciókká alakítja át a szöveges adatokat.
- Rejtett Di kulcslefoglalás: Témakör-modellezést végez az LDA Vowpal Wabbit kódtárával.
- nevesített entitások felismerése: Felismeri a megnevezett entitásokat egy szöveges oszlopban.
- Szöveg előfeldolgozása: Tisztítási műveleteket végez a szövegen.
- Vowpal Wabbit 7-4 modell pontozása: Az Azure által bevitt pontszámok a Vowpal Wabbit gépi tanulási rendszer 7-4-es verziójával.
- Score Vowpal Wabbit 7-10 Model: Scores input from Azure by using version 7-10 of the Vowpal Wabbit machine learning system.
- Score Vowpal Wabbit 8 Model: Scores input from Azure by using the 8 version of the Vowpal Wabbit machine learning system.
- Vowpal Wabbit 7-4 modell betanítás: Modell betanítás a Vowpal Wabbit gépi tanulási rendszer 7-4-es verziójával.
- Vowpal Wabbit 7-10 modell betanítás: Modell betanítás a Vowpal Wabbit gépi tanulási rendszer 7-10-es verziójával.
- Vowpal Wabbit 8 modell betanítás: Modell betanítás a Vowpal Wabbit gépi tanulási rendszer 8-as verziójával.