Modell betanítása összetevő

Cikk
06/03/2023

Ez a cikk az Azure Machine Learning-tervező egy összetevőjét ismerteti.

Ezzel az összetevővel betanítsa a besorolási vagy regressziós modellt. A betanítás azután történik, hogy definiált egy modellt, és beállította annak paramétereit, és címkézett adatokat igényel. A Modell betanításával új adatokkal újratanítást is végezhet egy meglévő modellen.

A betanítási folyamat működése

Az Azure Machine Learningben a gépi tanulási modell létrehozása és használata általában három lépésből áll.

A modell konfigurálásához válasszon ki egy adott algoritmustípust, és határozza meg annak paramétereit vagy hiperparamétereit. Válasszon az alábbi modelltípusok közül:
- Neurális hálózatokon, döntési fákon, döntési erdőkön és más algoritmusokon alapuló besorolási modellek.
- Regressziós modellek, amelyek tartalmazhatnak standard lineáris regressziót, vagy amelyek más algoritmusokat használnak, beleértve a neurális hálózatokat és a Bayes-regressziót.
Adjon meg egy címkézett és az algoritmussal kompatibilis adatokat tartalmazó adathalmazt. Csatlakoztassa az adatokat és a modellt a Modell betanítása szolgáltatáshoz.

A betanítás egy adott bináris formátum, az iLearner, amely az adatokból tanult statisztikai mintákat foglalja magában. Ezt a formátumot nem módosíthatja vagy olvashatja közvetlenül; más összetevők azonban használhatják ezt a betanított modellt.

A modell tulajdonságait is megtekintheti. További információ: Eredmények szakasz.
A betanítás befejezése után használja a betanított modellt az egyik pontozási összetevővel, hogy előrejelzéseket készítsen az új adatokról.

A modell betanítása

Adja hozzá a Modell betanítása összetevőt a folyamathoz. Ezt az összetevőt a Machine Learning kategóriában találja. Bontsa ki a Betanítás elemet, majd húzza a Modell betanítása összetevőt a folyamatba.
A bal oldali bemeneten csatlakoztassa a nem betanított módot. Csatolja a betanítási adatkészletet a Modell betanítása jobb oldali bemenetéhez.

A betanítási adatkészletnek tartalmaznia kell egy címkeoszlopot. A címkék nélküli sorok figyelmen kívül lesznek hagyva.
A Label (Címke) oszlopnál kattintson az Oszlop szerkesztése elemre az összetevő jobb oldali paneljén, és válasszon ki egy olyan oszlopot, amely a modell által a betanításhoz használható eredményeket tartalmazza.
- Besorolási problémák esetén a címkeoszlopnak kategorikus vagy különálló értékeket kell tartalmaznia. Néhány példa lehet egy igen/nem minősítés, egy betegségbesorolási kód vagy név, vagy egy jövedelemcsoport. Ha nem akategorikus oszlopot választ, az összetevő hibát ad vissza a betanítás során.
- Regressziós problémák esetén a címkeoszlopnak numerikus adatokat kell tartalmaznia, amelyek a válaszváltozót jelölik. Ideális esetben a numerikus adatok folyamatos skálázást jelölnek.
Ilyen lehet például a hitelkockázati pontszám, a merevlemez meghibásodásának előrejelzett ideje, vagy egy adott napon vagy időpontban a call centerbe irányuló hívások előrejelzett száma. Ha nem numerikus oszlopot választ, hibaüzenet jelenhet meg.
- Ha nem adja meg, hogy melyik címkeoszlopot használja, az Azure Machine Learning az adathalmaz metaadatainak használatával megpróbálja kikövetkeztetni, hogy melyik a megfelelő címkeoszlop. Ha nem a megfelelő oszlopot választja, az oszlopválasztóval javítsa ki.
Tipp

Ha nem tudja használni az Oszlopválasztót, tippekért tekintse meg az Adathalmaz oszlopainak kijelölése című cikket. Néhány gyakori forgatókönyvet és tippet ismertet a WITH RULES és a BY NAME beállítás használatához.
Küldje el a folyamatot. Ha sok adata van, az eltarthat egy ideig.

Fontos

Ha van egy azonosító oszlopa, amely az egyes sorok azonosítója, vagy egy szövegoszlop, amely túl sok egyedi értéket tartalmaz, a Modell betanítása hibaüzenetet kaphat, például: "A(z) "{column_name}" oszlopban lévő egyedi értékek száma nagyobb az engedélyezettnél.

Ennek az az oka, hogy az oszlop elérte az egyedi értékek küszöbértékét, és memóriakihasználtságot okozhat. A Metaadatok szerkesztése funkcióval megjelölheti ezt az oszlopot Törlés funkcióként , és nem használható a betanításban, vagy N-Gram-szolgáltatások kinyerésére a Szöveg összetevőből a szövegoszlop előfeldolgozásához. További hibaadatokért lásd: Tervező hibakód.

Modellértelmezhetőség

A modellértelmezhetőség lehetővé teszi az ML-modell megértését és a döntéshozatal alapjául szolgáló alap bemutatását az emberek számára érthető módon.

A Modell betanítása összetevő jelenleg támogatja az értelmezőcsomag használatát az ML-modellek magyarázatához. Az alábbi beépített algoritmusok támogatottak:

Lineáris regresszió
Neurális hálózat típusú regresszió
Növelt decistion tree regresszió
Döntési erdő típusú regresszió
Poisson-regresszió
Kétosztályos logisztikai regresszió
Kétosztályos támogató vektorgép
Two-Class növelt decistion fa
Kétosztályos döntési erdő
Többosztályos döntési erdő
Többosztályos logisztikai regresszió
Többosztályos neurális hálózat

Modellmagyarázatok létrehozásához válassza az Igaz lehetőséget a Modellmagyarázat betanítása összetevő legördülő listájában. Alapértelmezés szerint False (Hamis) értékre van állítva a Modell betanítása összetevőben. Vegye figyelembe, hogy a magyarázat létrehozásához további számítási költségekre van szükség.

Képernyőkép a modell magyarázata jelölőnégyzetről

Miután a folyamatfuttatás befejeződött, a Modell betanítása összetevő jobb oldali paneljének Magyarázatok lapjára látogathat, és megismerheti a modell teljesítményét, az adathalmazt és a funkció fontosságát.

Képernyőkép a modellmagyarázat-diagramokról

Ha többet szeretne megtudni a modellmagyarázatok Azure Machine Learningben való használatáról, tekintse meg az ML-modellek értelmezéséről szóló útmutató cikket.

Results (Eredmények)

A modell betanítása után:

Ha a modellt más folyamatokban szeretné használni, válassza ki az összetevőt, és válassza az Adathalmaz regisztrálása ikont a jobb oldali panel Kimenetek lapján. A mentett modellek az összetevők palettáján, az Adatkészletek területen érhetők el.
Ha a modellt új értékek előrejelzéséhez szeretné használni, csatlakoztassa a Modell pontozása összetevőhöz az új bemeneti adatokkal együtt.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .

Megosztás a következőn keresztül: