A döntési fa regressziós összetevőjének növelése

Cikk
06/01/2023

Ez a cikk az Azure Machine Learning designer egy összetevőjét ismerteti.

Ezzel az összetevővel regressziós fákból álló együttest hozhat létre a kiemeléssel. A kiemelés azt jelenti, hogy minden fa a korábbi fáktól függ. Az algoritmus az azt megelőző fák reziduálisának illesztésével tanul. Így a döntési fa együttes növelése általában növeli a pontosságot, és kisebb a lefedettség kockázata.

Ez az összetevő a LightGBM algoritmuson alapul.

Ez a regressziós módszer felügyelt tanulási módszer, ezért címkézett adatkészletet igényel. A címkeoszlopnak numerikus értékeket kell tartalmaznia.

Megjegyzés

Ezt az összetevőt csak numerikus változókat használó adathalmazokkal használja.

Miután definiálta a modellt, a modell betanítása a Modell betanítása paranccsal.

További információ a felerősített regressziós fákról

A kiemelés számos klasszikus módszer egyike az együttes modellek létrehozására, a zsákolással, a véletlenszerű erdőkkel és így tovább. Az Azure Machine Learningben a megnövelt döntési fák a MART színátmenet-növelő algoritmus hatékony implementálását használják. A gradiens felerősítés a regressziós problémák gépi tanulási technikája. Lépésenkénti módon hozza létre az egyes regressziós fákat egy előre definiált veszteségfüggvény használatával az egyes lépések hibáinak mérésére és a következő lépésben való javítására. Így az előrejelzési modell valójában a gyengébb előrejelzési modellek együttese.

Regressziós problémák esetén a kiemelés lépésről lépésre építi fel a fákat, majd kiválasztja az optimális fát egy tetszőleges, megkülönböztethető veszteségfüggvény használatával.

További információt az alábbi cikkekben talál:

https://wikipedia.org/wiki/Gradient_boosting#Gradient_tree_boosting

Ez a Wikipedia-cikk a színátmenetes kiemelésről biztosít némi hátteret a felturbózott fákról.

https://research.microsoft.com/apps/pubs/default.aspx?id=132652

Microsoft Research: A RankNettől a LambdaRankon át a LambdaMARTig: Áttekintés. J.C. Burges írta.

A gradiens felerősítési módszer besorolási problémák esetén is használható, ha megfelelő veszteségfüggvénnyel csökkenti a regressziót. További információ a kiemelt fák besorolási feladatokhoz való megvalósításáról: Kétosztályos kiemelt döntési fa.

A kiemelt döntési fa regresszió konfigurálása

Adja hozzá a kiemelt döntési fa összetevőt a folyamathoz. Ezt az összetevőt a Gépi tanulásInicializálás területén, a Regresszió kategóriában találja.
A Modell betanításának módját a Tréner mód létrehozása beállítással adhatja meg.
- Egyetlen paraméter: Válassza ezt a lehetőséget, ha tudja, hogyan szeretné konfigurálni a modellt, és adjon meg egy adott értékkészletet argumentumként.
- Paramétertartomány: Válassza ezt a lehetőséget, ha nem biztos a legjobb paraméterekben, és paraméter-takarítást szeretne futtatni. Válasszon ki egy értéktartományt, és a Modell hiperparamétereinek finomhangolása a megadott beállítások összes lehetséges kombinációját átterjedve határozza meg az optimális eredményt eredményező hiperparamétereket.
A levelek maximális száma fánként: A fákon létrehozható terminálcsomópontok (levelek) maximális számát jelzi.

Ennek az értéknek a növelésével növelheti a fa méretét, és nagyobb pontosságot érhet el a túlillesztés és a hosszabb betanítási idő kockázatával.
Levélcsomópontonkénti minták minimális száma: A fa bármely terminálcsomópont (levél) létrehozásához szükséges esetek minimális számát jelzi.

Az érték növelésével megnövelheti az új szabályok létrehozásának küszöbértékét. Ha például az alapértelmezett érték 1, akár egyetlen esettel is létrejön egy új szabály. Ha az értéket 5-re növeli, a betanítási adatoknak legalább 5 olyan esetet kell tartalmazniuk, amelyek megfelelnek az azonos feltételeknek.
Tanulási arány: Írjon be egy 0 és 1 közötti számot, amely meghatározza a lépés méretét a tanulás során. A tanulási sebesség határozza meg, hogy a tanuló milyen gyorsan vagy lassan konvergál az optimális megoldáson. Ha a lépés mérete túl nagy, előfordulhat, hogy túllépi az optimális megoldást. Ha a lépés mérete túl kicsi, a betanítás hosszabb időt vesz igénybe a legjobb megoldás konvergálásához.
Létrehozott fák száma: Az együttesben létrehozandó döntési fák teljes számát jelzi. További döntési fák létrehozásával jobb lefedettséget érhet el, de a betanítási idő nő.

Ha az értéket 1 értékre állítja; azonban csak egy fa jön létre (a kezdeti paraméterkészlettel rendelkező fa), és nem végeznek további iterációkat.
Véletlenszerű számmag: Írjon be egy nem negatív egész számot, amelyet véletlenszerű magértékként szeretne használni. A magok megadása biztosítja az azonos adatokkal és paraméterekkel rendelkező futtatások reprodukálhatóságát.

Alapértelmezés szerint a véletlenszerű mag értéke 0, ami azt jelenti, hogy a kezdeti magértéket a rendszeróra adja meg.
A modell betanítása:
- Ha az Oktatói mód létrehozása beállítást egyetlen paraméterre állítja, csatlakoztassa a címkézett adatkészletet és a Modell betanítása összetevőt.
- Ha az Oktatói mód létrehozása paramétertartomány értékre van állítva, csatlakoztassa a címkézett adatkészletet, és a modell betanítása a Modell hiperparamétereinek finomhangolása használatával.
Megjegyzés

Ha paramétertartományt ad át a Modell betanítása szolgáltatásnak, az csak az egyetlen paraméterlistában szereplő alapértelmezett értéket használja.

Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása összetevőnek, amikor az az egyes paraméterekre vonatkozó beállítástartományt vár, figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanulóhoz.

Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az adott értéket használja a takarítás során, még akkor is, ha más paraméterek egy értéktartományon belül változnak.
Küldje el a folyamatot.

Results (Eredmények)

A betanítás befejezése után:

A modell pontozáshoz való használatához csatlakoztassa a Modell betanítása a modell pontozásához, hogy előrejelezhesse az új bemeneti példák értékeit.
A betanított modell pillanatképének mentéséhez válassza a Kimenetek lapot a Betanított modell jobb oldali paneljén, és kattintson az Adathalmaz regisztrálása ikonra. A betanított modell másolata összetevőként lesz mentve az összetevő fájában, és nem frissül a folyamat egymást követő futtatásaikor.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .

Megosztás a következőn keresztül: