Modell betanítása összetevő
Ez a cikk az Azure Machine Learning-tervező egy összetevőjét ismerteti.
Ezzel az összetevővel betanítsa a besorolási vagy regressziós modellt. A betanítás azután történik, hogy definiált egy modellt, és beállította annak paramétereit, és címkézett adatokat igényel. A Modell betanításával új adatokkal újratanítást is végezhet egy meglévő modellen.
A betanítási folyamat működése
Az Azure Machine Learningben a gépi tanulási modell létrehozása és használata általában három lépésből áll.
A modell konfigurálásához válasszon ki egy adott algoritmustípust, és határozza meg annak paramétereit vagy hiperparamétereit. Válasszon az alábbi modelltípusok közül:
- Neurális hálózatokon, döntési fákon, döntési erdőkön és más algoritmusokon alapuló besorolási modellek.
- Regressziós modellek, amelyek tartalmazhatnak standard lineáris regressziót, vagy amelyek más algoritmusokat használnak, beleértve a neurális hálózatokat és a Bayes-regressziót.
Adjon meg egy címkézett és az algoritmussal kompatibilis adatokat tartalmazó adathalmazt. Csatlakoztassa az adatokat és a modellt a Modell betanítása szolgáltatáshoz.
A betanítás egy adott bináris formátum, az iLearner, amely az adatokból tanult statisztikai mintákat foglalja magában. Ezt a formátumot nem módosíthatja vagy olvashatja közvetlenül; más összetevők azonban használhatják ezt a betanított modellt.
A modell tulajdonságait is megtekintheti. További információ: Eredmények szakasz.
A betanítás befejezése után használja a betanított modellt az egyik pontozási összetevővel, hogy előrejelzéseket készítsen az új adatokról.
A modell betanítása
Adja hozzá a Modell betanítása összetevőt a folyamathoz. Ezt az összetevőt a Machine Learning kategóriában találja. Bontsa ki a Betanítás elemet, majd húzza a Modell betanítása összetevőt a folyamatba.
A bal oldali bemeneten csatlakoztassa a nem betanított módot. Csatolja a betanítási adatkészletet a Modell betanítása jobb oldali bemenetéhez.
A betanítási adatkészletnek tartalmaznia kell egy címkeoszlopot. A címkék nélküli sorok figyelmen kívül lesznek hagyva.
A Label (Címke) oszlopnál kattintson az Oszlop szerkesztése elemre az összetevő jobb oldali paneljén, és válasszon ki egy olyan oszlopot, amely a modell által a betanításhoz használható eredményeket tartalmazza.
Besorolási problémák esetén a címkeoszlopnak kategorikus vagy különálló értékeket kell tartalmaznia. Néhány példa lehet egy igen/nem minősítés, egy betegségbesorolási kód vagy név, vagy egy jövedelemcsoport. Ha nem akategorikus oszlopot választ, az összetevő hibát ad vissza a betanítás során.
Regressziós problémák esetén a címkeoszlopnak numerikus adatokat kell tartalmaznia, amelyek a válaszváltozót jelölik. Ideális esetben a numerikus adatok folyamatos skálázást jelölnek.
Ilyen lehet például a hitelkockázati pontszám, a merevlemez meghibásodásának előrejelzett ideje, vagy egy adott napon vagy időpontban a call centerbe irányuló hívások előrejelzett száma. Ha nem numerikus oszlopot választ, hibaüzenet jelenhet meg.
- Ha nem adja meg, hogy melyik címkeoszlopot használja, az Azure Machine Learning az adathalmaz metaadatainak használatával megpróbálja kikövetkeztetni, hogy melyik a megfelelő címkeoszlop. Ha nem a megfelelő oszlopot választja, az oszlopválasztóval javítsa ki.
Tipp
Ha nem tudja használni az Oszlopválasztót, tippekért tekintse meg az Adathalmaz oszlopainak kijelölése című cikket. Néhány gyakori forgatókönyvet és tippet ismertet a WITH RULES és a BY NAME beállítás használatához.
Küldje el a folyamatot. Ha sok adata van, az eltarthat egy ideig.
Fontos
Ha van egy azonosító oszlopa, amely az egyes sorok azonosítója, vagy egy szövegoszlop, amely túl sok egyedi értéket tartalmaz, a Modell betanítása hibaüzenetet kaphat, például: "A(z) "{column_name}" oszlopban lévő egyedi értékek száma nagyobb az engedélyezettnél.
Ennek az az oka, hogy az oszlop elérte az egyedi értékek küszöbértékét, és memóriakihasználtságot okozhat. A Metaadatok szerkesztése funkcióval megjelölheti ezt az oszlopot Törlés funkcióként , és nem használható a betanításban, vagy N-Gram-szolgáltatások kinyerésére a Szöveg összetevőből a szövegoszlop előfeldolgozásához. További hibaadatokért lásd: Tervező hibakód.
Modellértelmezhetőség
A modellértelmezhetőség lehetővé teszi az ML-modell megértését és a döntéshozatal alapjául szolgáló alap bemutatását az emberek számára érthető módon.
A Modell betanítása összetevő jelenleg támogatja az értelmezőcsomag használatát az ML-modellek magyarázatához. Az alábbi beépített algoritmusok támogatottak:
- Lineáris regresszió
- Neurális hálózat típusú regresszió
- Növelt decistion tree regresszió
- Döntési erdő típusú regresszió
- Poisson-regresszió
- Kétosztályos logisztikai regresszió
- Kétosztályos támogató vektorgép
- Two-Class növelt decistion fa
- Kétosztályos döntési erdő
- Többosztályos döntési erdő
- Többosztályos logisztikai regresszió
- Többosztályos neurális hálózat
Modellmagyarázatok létrehozásához válassza az Igaz lehetőséget a Modellmagyarázat betanítása összetevő legördülő listájában. Alapértelmezés szerint False (Hamis) értékre van állítva a Modell betanítása összetevőben. Vegye figyelembe, hogy a magyarázat létrehozásához további számítási költségekre van szükség.
Miután a folyamatfuttatás befejeződött, a Modell betanítása összetevő jobb oldali paneljének Magyarázatok lapjára látogathat, és megismerheti a modell teljesítményét, az adathalmazt és a funkció fontosságát.
Ha többet szeretne megtudni a modellmagyarázatok Azure Machine Learningben való használatáról, tekintse meg az ML-modellek értelmezéséről szóló útmutató cikket.
Results (Eredmények)
A modell betanítása után:
Ha a modellt más folyamatokban szeretné használni, válassza ki az összetevőt, és válassza az Adathalmaz regisztrálása ikont a jobb oldali panel Kimenetek lapján. A mentett modellek az összetevők palettáján, az Adatkészletek területen érhetők el.
Ha a modellt új értékek előrejelzéséhez szeretné használni, csatlakoztassa a Modell pontozása összetevőhöz az új bemeneti adatokkal együtt.
Következő lépések
Tekintse meg az Azure Machine Learning számára elérhető összetevőket .
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: