Modell betanítása
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Besorolási vagy regressziós modell felügyelt módon történő beképzása
Kategória: Machine Learning / Betanítás
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használható a Machine Learning Studio Modell betanítása modulja egy besorolási vagy regressziós modell betanítására. A betanítás azután történik, hogy definiált egy modellt és beállította annak paramétereit, és címkézett adatokat igényel. A Train Model (Modell betanítása) lehetőség használatával újra betaníthat egy meglévő modellt új adatokkal.
A betanítási folyamat működése
A Machine Learning gépi tanulási modell létrehozása és használata általában három lépésből áll.
A modellt egy adott algoritmustípus kiválasztásával, valamint a paraméterek vagy hiperparaméterek meghatározásával konfigurálhatja. Válassza ki az alábbi modelltípusok bármelyikét:
- Neurális hálózatokon, döntési fákon, döntési erdőkön és más algoritmuson alapuló besorolási modellek.
- Regressziós modellek, amelyek standard lineáris regressziót tartalmazhatnak, vagy más algoritmusokat, például neurális hálózatokat és Bays-regressziót használhatnak.
Adjon meg egy címkével jelölt adatkészletet, amely az algoritmussal kompatibilis adatokkal rendelkezik. Csatlakozás az adatokat és a modellt is a modell betanítása érdekében.
A betanítás egy adott bináris formátumot hoz létre, az iLearnert, amely az adatokból megtanult statisztikai mintákat beágyazza. Ezt a formátumot nem módosíthatja vagy olvashatja közvetlenül; A Studio többi modulja (klasszikus) azonban használhatja ezt a betanított modellt.
A modell tulajdonságait is megtekintheti. További információkért lásd az Eredmények szakaszt .
A betanítás befejezése után használja a betanított modellt az egyik pontozási modullal , hogy előrejelzéseket készítsen az új adatokról.
Megjegyzés
Más speciális gépi tanulási feladatokhoz különböző betanító módszerekre van szükség, és a Studio (klasszikus) külön képzési modulokat biztosít számukra. Például a képészlelés, a fürtözés és az anomáliadetektálás mind egyéni betanítési módszereket használ. A Train Model (Modell betanítása) csak regressziós és besorolási modellekkel való használatra szolgál.
Felügyelt és felügyelet nélküli képzés
Lehet, hogy hallotta már a felügyelt vagy a felügyelet nélküli tanulás kifejezéseket. Egy besorolási vagy regressziós modell betanítása a Modell betanítása segítségével klasszikus példa a felügyelt gépi tanulásra. Ez azt jelenti, hogy meg kell adnia egy adatkészletet, amely előzményadatokat tartalmaz, amelyekből mintákat tanulhat. Az adatoknak tartalmaznia kell az előrejelezni próbált eredményt (címkét) és a kapcsolódó tényezőket (változókat). A gépi tanulási modellnek szüksége van az eredményekre az eredmények legjobb előrejelzéséhez szükséges jellemzők meghatározásához.
A betanítási folyamat során az adatok eredmények szerint vannak rendezve, és az algoritmus statisztikai mintákat von ki a modell felépítéséhez.
A nem felügyelet nélküli tanulás azt jelzi, hogy az eredmény ismeretlen, vagy ha úgy dönt, hogy nem használ ismert címkéket. A fürtözési algoritmusok például általában nem felügyelet nélküli tanulási módszereket alkalmaznak, de használhatnak címkéket, ha elérhetők. Egy másik példa a témakörmodellezés az LDA használatával. Ezekkel az algoritmusokkal nem használható a Modell betanítása.
Tipp
Még csak most tanulja a gépi tanulást? Ez az oktatóanyag végigvezeti az adatok beszerzésének, az algoritmus konfigurálásának, a betanításnak és a modell használatának folyamatán: Az első gépi tanulási kísérlet létrehozása
Modell betanításának használata
A Machine Learning Studióban (klasszikus) konfigurálja a besorolási modellt vagy a regressziós modellmodelleket.
Az R-modell létrehozása használatával létrehozott egyéni modellt is betaníthat.
Adja hozzá a kísérlethez a Train Model (Modell betanítása) modult. Ezt a modult a következő kategóriában találja Machine Learning kategóriában. Bontsa ki a Betanítás bontsa ki, majd húzza a kísérletbe a Modell betanítása modult.
A bal oldali bemeneten csatolja a nem képezett módot. Csatolja a betanítás adatkészletet a Train Model (Modell betanítása) jobb oldali bemenetéhez.
A betanítás adatkészletének tartalmaznia kell egy címkeoszlopot. A rendszer figyelmen kívül hagyja a címkék nélküli sorokat.
A Címke oszlop esetében kattintson az Oszlopválasztó indítása elemre, és válasszon ki egyetlen oszlopot, amely a modell által a betanításhoz használható eredményeket tartalmazza.
Besorolási problémák esetén a címkeoszlopnak kategorikus vagy különálló értékeket kell tartalmaznia . Néhány példa lehet az igen/nem minősítés, a betegség osztályozási kódja vagy neve, vagy egy bevételi csoport. Ha nem kategorikus oszlopot választ, a modul hibát ad vissza a betanítás során.
Regressziós problémák esetén a címkeoszlopnak a válaszváltozónak megfelelő numerikus adatokat kell tartalmaznia. Ideális esetben a numerikus adatok folyamatos skálát képviselnek.
Ilyen lehet például a hitelkockázati pontszám, a merevlemez meghibásodásának előre jelzett ideje, vagy egy adott napon vagy időpontban a hívóközpont felé intézett hívások előre jelzett száma. Ha nem numerikus oszlopot választ, hibaüzenetet kap.
- Ha nem adja meg, hogy melyik címkeoszlopot használja, Machine Learning az adatkészlet metaadatai alapján megpróbálja kiveszni, hogy melyik a megfelelő címkeoszlop. Ha nem a megfelelő oszlopot választja ki, az oszlopválasztóval javítsa ki.
Tipp
Ha problémája van az oszlopválasztó használatával, tippekért tekintse meg a Select Columns in Dataset ( Adatkészlet oszlopainak kijelölése) cikket. Ismertet néhány gyakori forgatókönyvet és tippet a WITH RULES és a BY NAME beállítások használatához .
Futtassa a kísérletet. Ha sok adata van, ez egy kis ideig is el fog tetsszen.
Results (Eredmények)
A modell betanítás után:
A modellparaméterek és a jellemzősúlyok megtekintéséhez kattintson a jobb gombbal a kimenetre, és válassza a Képi megjelenítés lehetőséget.
Ha más kísérletekben is használni kívánt modellt, kattintson a jobb gombbal a modellre, és válassza a Modell mentése lehetőséget. Adja meg a modell nevét.
Ez olyan pillanatképként menti a modellt, amelyet nem frissít a kísérlet ismételt futtatása.
Ha a modellt új értékek előrejelzéséhez szeretne használni, csatlakoztassa a Modell pontozása modulhoz az új bemeneti adatokkal együtt.
Kapcsolódó feladatok
Ha olyan modellt kell betanítanunk, amelyet a Modell betanítás nem támogat, több lehetőség közül választhat:
Hozzon létre egy egyéni pontozási metódust R-szkript használatával, vagy használja az elérhető számos R pontozási csomag valamelyikét.
Írjon egy saját Python-szkriptet egy modell betanítához és pontozásához, vagy használjon egy meglévő Python-kódtárat:
Anomáliadetektálási modellek
- Az Anomáliadetektálási modell betanítése a Studio (klasszikus) anomáliadetektálási moduljait támogatja.
Javaslatmodellek
Ha a modell az Machine Learning által ajánlott Matchboxot használja, használja a Train Matchbox Recommender modult.
Ha más algoritmust használ a market basket elemzéshez vagy javaslathoz, használja a betanítás módszereit R-szkriptben vagy Python-szkriptben.
Fürtözési modellek
A mellékelt K-means algoritmushoz használja a Fürtözési modell betanítása algoritmust.
Más fürtözési modellek esetében R-szkript vagy Python-szkriptmodulok használatával konfigurálhatja és betaníthatja a modelleket.
Példák
A Modell betanítás modul machine learning-kísérletekben való használatára vonatkozó példákért tekintse meg ezeket a kísérleteket a Azure AI Gallery:
- Kiskereskedelmi előrejelzés: Bemutatja, hogyan lehet több modellt összeépíteni, betanítani és összehasonlítani.
- Repülőjárat késésének előrejelzése: Bemutatja, hogyan lehet több kapcsolódó besorolási modellt betanítani.
Várt bemenetek
Név | Típus | Description |
---|---|---|
Nem képezett modell | ILearner interfész | Nem képezett tanuló |
Adathalmaz | Adattábla | Betanítási adatok |
Modulparaméterek
Name | Tartomány | Típus | Alapértelmezett | Description |
---|---|---|---|---|
Felirat oszlop | bármelyik | ColumnSelection (Oszlopválasztás) | Válassza ki azt az oszlopot, amely a címke vagy az eredmény oszlopot tartalmazza |
Kimenetek
Név | Típus | Description |
---|---|---|
Betanított modell | ILearner interfész | Betanított tanuló |
Kivételek
A modulhibák listájáért lásd: Modul hibakódok.
Kivétel | Description |
---|---|
0032-es hiba | Kivétel akkor fordul elő, ha az argumentum nem szám. |
0033-as hiba | Kivétel akkor fordul elő, ha az argumentum végtelen. |
0083-as hiba | Kivétel akkor fordul elő, ha a betanításhoz használt adatkészlet nem használható konkrét tanulótípushoz. |
0035-ös hiba | Kivétel akkor fordul elő, ha nem biztosítanak szolgáltatásokat egy adott felhasználóhoz vagy elemhez. |
0003-as hiba | Kivétel akkor fordul elő, ha egy vagy több bemenet null vagy üres. |
0020-as hiba | Kivétel akkor fordul elő, ha a modulnak átadott egyes adatkészletek oszlopainak száma túl kicsi. |
0021-es hiba | Kivétel akkor fordul elő, ha a modulnak átadott egyes adathalmazok sorai túl kicsik. |
0013-as hiba | Kivétel akkor fordul elő, ha a modul tanulója számára átadott típus érvénytelen. |