ML Studio (klasszikus) modul leírásai
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Ez a témakör áttekintést nyújt a Machine Learning Studio (klasszikus) moduljairól, amely egy interaktív, vizuális munkaterület, amellyel egyszerűen lehet prediktív modelleket összeépíteni és tesztelni.
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
Mit nevezünk modulnak?
A Machine Learning Studio (klasszikus) modulja a kísérletek létrehozásának építőeleme. Minden modul egy adott gépi tanulási algoritmust, függvényt vagy kódtárat tartalmaz, amely képes a munkaterületen lévő adatokra. A modulok úgy vannak kialakítva, hogy más modulokból is fogadjanak kapcsolatokat az adatok megosztásához és módosításához.
Az egyes modulokban futó kód számos forrásból származik. Ezek közé nyílt forráskód kódtárak és nyelvek, a Microsoft Research által fejlesztett algoritmusok, valamint az Azure-ral és más felhőszolgáltatásokkal való munkavégzéshez szükséges eszközök.
Tipp
Gépi tanulási algoritmusokat keres? Tekintse meg a Machine Learning kategóriát, amely többek között a döntési fákhoz, fürtözéshez és neurális hálózatokhoz tartalmaz modulokat. A Betanítás és értékelés kategóriák olyan modulokat tartalmaznak, amelyek segítenek a modellek betanításában és tesztelésében.
A modulok csatlakoztatásával és konfigurálásával létrehozhat egy munkafolyamatot, amely külső forrásokból olvas be adatokat, előkészíti őket az elemzéshez, gépi tanulási algoritmusokat alkalmaz, és eredményeket hoz létre.
Ha egy kísérlet meg van nyitva a Machine Learning Studióban (klasszikus), a bal oldali navigációs panelen megjelenik az aktuális modulok teljes listája. Ezeket az építőelemeket a kísérletbe húzhatja, majd összekapcsolhatja őket egy teljes gépi tanulási munkafolyamat, az úgynevezett kísérlet létrehozásához.
Előfordulhat, hogy a modulok frissülnek, hogy új funkciókat adjanak hozzá, vagy eltávolítsa a régebbi kódot. Ha ez történik, a modult használva létrehozott kísérletek tovább futnak. Amikor azonban legközelebb megnyitja a kísérletet, a rendszer arra kéri, hogy frissítse a modult, vagy használjon egy másik modult.
Példák
A teljes gépi tanulási kísérlet felépítésére az alábbi oktatóanyagokban láthat példát:
Modulkategóriák
A kapcsolódó modulok könnyebb megtalálás érdekében a Machine Learning Studio (klasszikus) gépi tanulási eszközei ezen kategóriák szerint vannak csoportosítva.
Adatformátum-átalakítások
Ezekkel a modulokkal más gépi tanulási eszközök vagy formátumok által használt formátumok egyikére konvertálhatja az adatokat.
-
Ezekkel a modulokkal adatokat és modelleket olvashat be felhőbeli adatforrásból, például Hadoop-fürtökből, Azure Table Storage-ból és webes URL-címekről. Ezeket a modulokat arra is használhatja, hogy eredményeket írjon a tárolóba vagy egy adatbázisba.
-
Ezekkel a modulokkal előkészítheti az adatokat az elemzéshez. Módosíthatja az adattípusokat, megjelölheti az oszlopokat jellemzőkként vagy címkékként, funkciókat hozhat létre, valamint skálázhatja vagy normalizálhatja az adatokat.
-
Digitális jelfeldolgozásból származó numerikus adatok átalakítása.
-
Közös valószínűségi eloszlásokkal olyan jellemzőket építhet ki, amelyek tömören írják le a nagy adatkészleteket.
-
Ez a csoport számos adattudományi eszközt biztosít. Eltávolíthatja vagy lecserélheti például a hiányzó értékeket, kiválaszthatja az oszlopok egy részkészletét, oszlopot adhat hozzá, vagy össze is egyesíthet két adatkészletet.
-
Az adathalmazokat feltételek vagy méret alapján oszthatja el betanítás és tesztelési készletek létrehozásához, vagy bizonyos sorok elkülönítéséhez.
-
Numerikus adatok átalakítása.
Funkció kiválasztása
Ezekkel a modulokkal azonosíthatja az adatok legjobb funkcióit széles körben kutatott statisztikai módszerekkel.
Machine Learning
Ez a csoport tartalmazza a legtöbb gépi tanulási algoritmust, amelyet a Machine Learning.
Emellett olyan modulokat is tartalmaz, amelyek modellek betanítása, pontszámok generálása és a modell teljesítményének kiértékelása által támogatják az algoritmusokat.
-
Miután betanított egy modellt, ezekkel az eszközökkel mérheti a modell pontosságát.
-
Ezek a modulok biztosítják a gépi tanulási algoritmusokat, amelyeket paraméterek beállításával szabhat testre. Az ebben a szakaszban található algoritmusok típus szerint vannak csoportosítva:
-
Ezekkel a modulokkal új adatokat ad át az algoritmusnak, és eredmények készletét hozhatja létre kiértékelési céllal. A pontozás eredményeit prediktív szolgáltatás részeként is használhatja.
-
Ezek a modulok egy inicializált gépi tanulási modellt képeznek be a saját adatain.
OpenCV-könyvtármodulok
Ezek a modulok egyszerű hozzáférést adnak egy népszerű nyílt forráskód képfeldolgozáshoz és képosztályozáshoz.
R nyelvi modulok
Ezekkel a modulokkal egyéni R-kódot adhat a kísérlethez, vagy egy R-csomagon alapuló gépi tanulási modellt valósíthat meg.
Python nyelvi modulok
Ezekkel a modulokkal egyéni Python-kódot adhat a kísérlethez.
Statisztikai függvények
Ezekkel a modulokkal valószínűségi eloszlásokat számíthat ki, egyéni számításokat hozhat létre, és számos, numerikus változókhoz kapcsolódó egyéb feladatot végezhet el.
Text Analytics
Ezekkel a modulokkal funkció-kivonatolást és nevesselt entitásfelismerést végezhet, vagy természetes nyelvi feldolgozási eszközökkel előfeldolgozást végezhet a szövegeken.
Idősorok
Ezekkel a modulokkal a trendek anomáliákat mérheti fel kifejezetten idősorozat-adatokhoz tervezett algoritmusok használatával.
Kapcsolódó feladatok
Machine Learning Studio (klasszikus) moduljai nem kísérlik meg duplikált adatintegrációs eszközök duplikálása más eszközök, például a Azure Data Factory. Ehelyett a modulok gépi tanulásra jellemző funkciókat biztosítanak:
- Adatok normalizálása, csoportosítása és skálázása
- Az adatok statisztikai eloszlásának számítása
- Átalakítás más gépi tanulási formátumokba
- A gépi tanulási kísérletekhez és az eredmények exportálására használt adatok importálása
- Szövegelemzés, funkcióválasztás és dimenziócsökkentés
Ha kifinomultabb eszközökre van szüksége az adatok kezeléséhez és tárolásához, tekintse meg a következőket:
- Azure Data Factory: Nagyvállalati használatra kész, felhőalapú adatfeldolgozási folyamatok.
- Azure SQL Database: Skálázható tárolás, integrált gépi tanulás-hozzáféréssel.
- CosmosDB: NoSQL-adattár; adatok importálása a Machine Learning Studióba (klasszikus).
- Azure Data Lake Analytics: Elosztott elemzés a big data.
- Stream Analytics: Eseményfeldolgozás a eszközök internetes hálózata.
- Azure Text Analytics: Több lehetőség a szövegfeldolgozásra és a Cognitive Services, képekre és arcfelismerésre.
- Azure Databricks: Spark-alapú elemzési platform.