Gépi tanulási modulok a ML Studio (klasszikus) moduljaiban
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
A gépi tanulás tipikus munkafolyamata számos fázisból áll:
A megoldani szükséges probléma azonosítása és az eredmények mérésére vonatkozó metrika.
A megfelelő adatok megkeresása, tisztítása és előkészítése.
A legjobb funkciók azonosítása és az új funkciók mérnöki tevékenységének azonosítása.
Modellek kiépítése, értékelése és finomhangolása.
Modellek használata előrejelzések, javaslatok és egyéb eredmények létrehozásához.
Az ebben a szakaszban található modulok eszközöket biztosítanak a gépi tanulás végső fázisaihoz, amelyekben egy algoritmust alkalmaz az adatokra a modell betanítása érdekében. Ezekben az utolsó fázisban pontszámokat is elő fog hozni, majd kiértékeli a modell pontosságát és hasznosságát.
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
Gépi tanulási feladatok listája kategória szerint
-
Számos testre szabható gépi tanulási algoritmus közül választhat, beleértve a fürtözést,a regressziót, a besorolást és az anomáliadetektálási modelleket.
-
Adja meg az adatokat a konfigurált modellnek, hogy tanuljanak a mintákból, és statisztikákat hozzanak létre, amelyek felhasználhatók az előrejelzésekhez.
-
Előrejelzések létrehozása a betanított modellekkel.
-
Egy betanított modell pontosságának mérése, vagy több modell összehasonlítása.
A kísérleti munkafolyamat részletes leírását a hitelkockázati megoldás bemutatóban láthatja.
Előfeltételek
A modellek elkészítésének szórakoztató részéhez általában sok előkészületre van szükség. Ez a szakasz a Machine Learning Studio (klasszikus) eszközeire mutató hivatkozásokat tartalmaz, amelyek segíthetnek az adatok tisztításában, a bemenet minőségének javításában és a futásidővel kapcsolatos hibák megelőzésében.
Adatfeltárás és adatminőség
Győződjön meg arról, hogy az adatok a megfelelő adatok, a megfelelő mennyiség és a választott algoritmusnak megfelelő minőség. Tudja meg, mennyi adata van, és hogyan oszlik el. Vannak ki- és betekerők? Hogyan generálták ezeket, és mit jelentenek? Vannak duplikált rekordok?
Hiányzó értékek kezelés
A hiányzó értékek sokféleképpen befolyásolhatják az eredményeket. Például szinte minden statisztikai metódus elveti a hiányzó értékekkel kapcsolatos eseteket. Alapértelmezés szerint a Machine Learning a következő szabályokat követi, ha hiányzó értékkel lévő sorokkal találkozik:
Ha a modell betanítása által használt adatokból hiányoznak értékek, a rendszer kihagyja a hiányzó értékeket tartalmazó sorokat.
Ha egy modell pontozásakor bemenetként használt adatokból hiányoznak értékek, a rendszer a hiányzó értékeket használja bemenetként, de a null értékeket propagálja. Ez általában azt jelenti, hogy érvényes előrejelzés helyett null érték lesz beszúrva az eredményekbe.
A modell betanítása előtt ellenőrizze az adatokat. A hiányzó értékek beiklására vagy az adatok kijavítására használja ezt a modult:
Funkciók kiválasztása és dimenziócsökkentés
Machine Learning Studio (klasszikus) segítségével átszitálhatja az adatokat, hogy megtalálja a leghasznosabb attribútumokat.
Olyan eszközökkel, mint a Linear Discriminant Analysis (Lineáris lineáris elemzés) vagy a Filter Based Feature Selection (Szűrőalapú jellemzőválasztás) határozza meg, hogy mely adatoszlopok a legdiktívabbak. Ezek az eszközök az adatszivárgás miatt eltávolítható oszlopokat is azonosítják.
Funkciók létrehozása vagy megmérnöke meglévő adatokból. Az adatok normalizálása vagy az adatok csoportosítása tárolókba új adatcsoportba, vagy a numerikus értékek tartományának szabványosítása az elemzés előtt.
Dimenziócsökkentés kategorikus értékek csoportosításával, fő összetevőelemzéssel vagymintavételezéssel.
Példák
A gépi tanulás gyakorlati példáiért lásd a Azure AI Gallery.
Tippekért és néhány tipikus adat-előkészítő feladat bemutatójért lásd: Útmutató a csapat adattudományi folyamatának végrehajtásához.