Two-Class Döntési fa kiemelése összetevő

Cikk
06/01/2023

Ez a cikk az Azure Machine Learning-tervező egy összetevőjét ismerteti.

Ezzel az összetevővel olyan gépi tanulási modellt hozhat létre, amely a megnövelt döntési fák algoritmusán alapul.

A megnövelt döntési fa egy együttes tanulási módszer, amelyben a második fa az első fa hibáit, a harmadik fa az első és a második fa hibáit korrigálja, és így tovább. Az előrejelzések az előrejelzést összehozó fák teljes együttesén alapulnak.

A megfelelően konfigurált döntési fák általában a legegyszerűbb módszerek arra, hogy a gépi tanulási feladatok széles skáláján csúcsteljesítményt érhessenek el. Ugyanakkor ők is a memóriaigényesebb tanulók egyike, és a jelenlegi implementáció mindent tartalmaz a memóriában. Ezért előfordulhat, hogy egy megnövelt döntésifa-modell nem tudja feldolgozni azokat a nagy adathalmazokat, amelyeket egyes lineáris tanulók kezelni tudnak.

Ez az összetevő LightGBM-algoritmuson alapul.

Konfigurálás

Ez az összetevő egy nem betanított besorolási modellt hoz létre. Mivel a besorolás felügyelt tanulási módszer, a modell betanítása érdekében olyan címkézett adatkészletre van szükség, amely egy címkeoszlopot tartalmaz, amely minden sorhoz tartalmaz egy értéket.

Az ilyen típusú modellek betanítása a Modell betanítása paranccsal történik.

Az Azure Machine Learningben adja hozzá a Kiemelt döntési fa összetevőt a folyamathoz.
A Modell betanításának módját az Oktatói mód létrehozása beállítással adhatja meg.
- Egyetlen paraméter: Ha tudja, hogyan szeretné konfigurálni a modellt, argumentumként megadhat egy adott értékkészletet.
- Paramétertartomány: Ha nem biztos a legjobb paraméterekben, a Modell hiperparaméterek hangolása összetevővel megtalálhatja az optimális paramétereket. Meg kell adnia néhány értéktartományt, és a tréner a beállítások több kombinációját is iterálja, hogy meghatározza a legjobb eredményt eredményező értékek kombinációját.
A Levelek maximális száma fánként lehetőségnél adja meg a bármely fában létrehozható terminálcsomópontok (levelek) maximális számát.

Ennek az értéknek a növelésével növelheti a fa méretét, és nagyobb pontosságot érhet el a túlillesztés és a hosszabb betanítási idő kockázatával.
A Levélcsomópontonkénti minták minimális száma értéknél adja meg, hogy hány eset szükséges a csomópontok (levél) fában való létrehozásához.

Az érték növelésével növeli az új szabályok létrehozásának küszöbértékét. Ha például az alapértelmezett érték 1, akár egyetlen esettel is létrejön egy új szabály. Ha az értéket 5-re növeli, a betanítási adatoknak legalább öt, azonos feltételeknek megfelelő esetet kell tartalmazniuk.
A Tanulási sebesség mezőbe írjon be egy 0 és 1 közötti számot, amely meghatározza a lépés méretét a tanulás során.

A tanulási sebesség határozza meg, hogy a tanuló milyen gyorsan vagy lassan konvergál az optimális megoldáson. Ha a lépés mérete túl nagy, előfordulhat, hogy túllépi az optimális megoldást. Ha a lépés mérete túl kicsi, a betanítás hosszabb időt vesz igénybe a legjobb megoldáshoz való konvergens konvergens megoldáshoz.
A Létrehozott fák száma területen adja meg az együttesben létrehozandó döntési fák teljes számát. További döntési fák létrehozásával jobb lefedettséget érhet el, de a betanítási idő nőni fog.

Ha az értéket 1 értékre állítja, csak egy fa jön létre (a kezdeti paraméterkészlettel rendelkező fa), és nem végez további iterációkat.
Véletlenszerű számmagok esetén nem negatív egész számot is beírhat véletlenszerű magértékként. A mag megadása biztosítja az azonos adatokkal és paraméterekkel rendelkező futtatások reprodukálhatóságát.

A véletlenszerű mag beállítása alapértelmezés szerint 0, ami azt jelenti, hogy a kezdeti magérték a rendszerórából származik. A véletlenszerű magot használó egymást követő futtatásoknak eltérő eredményei lehetnek.
A modell betanítása:
- Ha a Create trainer mode (Oktató létrehozása) módotegyetlen paraméterre állítja, csatlakoztassa a címkézett adatkészletet és a Train Model (Modell betanítása) összetevőt.
- Ha a Create trainer mode (Tréner létrehozása) módotParamétertartomány értékre állítja, csatlakoztassa a címkézett adatkészletet, és a modell betanítása a Modell hiperparamétereinek finomhangolása használatával.
Megjegyzés

Ha paramétertartományt ad át a Modell betanítása szolgáltatásnak, az csak az egyetlen paraméterlistában szereplő alapértelmezett értéket használja.

Ha egyetlen paraméterérték-készletet ad át a Modell hiperparamétereinek finomhangolása összetevőnek, amikor az minden paraméterhez egy beállítástartományt vár, figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanuló számára.

Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az adott értéket használja a takarítás során, még akkor is, ha más paraméterek egy értéktartományon belül változnak.

Results (Eredmények)

A betanítás befejezése után:

A betanított modell pillanatképének mentéséhez válassza a Kimenetek lapot a Modell betanítása összetevő jobb oldali paneljén. Válassza az Adathalmaz regisztrálása ikont a modell újrafelhasználható összetevőként való mentéséhez.
A modell pontozáshoz való használatához adja hozzá a Modell pontozása összetevőt egy folyamathoz.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .

Megosztás a következőn keresztül:

Two-Class Döntési fa kiemelése összetevő

Konfigurálás

Results (Eredmények)

Következő lépések

Visszajelzés

Visszajelzés

További források