Megosztás a következőn keresztül:


Súlyozott döntési fa típusú regresszió

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Regressziós modellt hoz létre a Boosted Decision Tree algoritmussal

Kategória: Machine Learning / Modell inicializálása / Regresszió

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk bemutatja, hogyan hozhat létre regressziós fákból álló együttest a Machine Learning Studio (klasszikus) Boosted Decision Tree Regression (Döntési fa regressziója) moduljával. A kiemelés azt jelenti, hogy minden fa a korábbi fáktól függ. Az algoritmus úgy tanul, hogy illeszti az azt megelőző fák reziduálisát. Így a döntési fa együttesen a növekedés általában javítja a pontosságot, és kisebb a lefedettség kockázata.

Ez a regressziós módszer felügyelt tanulási módszer, ezért címkével jelölt adatkészletet igényel. A címkeoszlopnak numerikus értékeket kell tartalmaznia.

Megjegyzés

Ezt a modult csak numerikus változókat tartalmazó adatkészletekkel használja.

Miután meghatározta a modellt, a Betanítás vagy a Modell hiperparaméterek hangolása modulokkal betaníthatja azt.

Tipp

Szeretne többet tudni a létrehozott fákról? A modell betanítás után kattintson a jobb gombbal a Train Model (Modell betanítására) modul (vagy a Modell hiperparaméterek hangolása) modul kimenetére, és válassza a Visualize (Képi megjelenítés) lehetőséget az egyes iterációkban létrehozott fa megjelenítéséhez. Lefúrhat az egyes fák felosztásaiba, és láthatja az egyes csomópontok szabályait.

További információ a kiemelt regressziós fákról

A növekedés az együttes modellek létrehozására használt klasszikus módszerek egyike, a címkézéssel, a véletlenszerű erdőkkel és így tovább. A Machine Learning Studióban (klasszikus) a megnövelt döntési fák a MART és gradient boosting hatékony implementációját használják. A színátmenet-növelés a regressziós problémák gépi tanulási technikája. Az egyes regressziós fákat lépésenként építi fel egy előre definiált veszteségfénnyel, amely minden lépésben méri a hibát, és kijavítja azt a következő lépésben. Így az előrejelzési modell valójában gyengébb előrejelzési modellek együttese.

Regressziós problémák esetén a kiemelés lépésenként építi fel a fák egy sorát, majd egy tetszőlegesen különböző veszteségfória használatával kiválasztja az optimális fát.

További információt a következő cikkekben talál:

A gradient boosting módszer besorolási problémákhoz is használható, ha egy megfelelő veszteségi funkcióval csökkenti a regressziót. A besorolási feladatokhoz a kiemelt fák implementációjával kapcsolatos további információkért lásd: Kétosztályos, kiemelt döntési fa.

A kiemelt döntési fa regresszió konfigurálása

  1. Adja hozzá a Boosted Decision Tree (Döntési fa növelése) modult a kísérlethez. Ezt a modult az Inicializálás Machine Learning, a Regression (Regresszió) kategóriában találja.

  2. Az Oktatói mód létrehozása lehetőség beállításával adja meg, hogyan szeretné betanítni a modellt.

    • Egyetlen paraméter: Válassza ezt a lehetőséget, ha tudja, hogyan szeretné konfigurálni a modellt, és argumentumként adjon meg egy adott értékkészletet.

    • Paramétertartomány: Válassza ezt a lehetőséget, ha nem biztos a legjobb paraméterekben, és paraméteres lekérdezést szeretne futtatni. Válasszon ki egy értéktartományt az iterációhoz, majd a Modell hiperparaméterek finomhangolása a megadott beállítások összes lehetséges kombinációján iterál az optimális eredményeket produkáló hiperparaméterek meghatározásához.

  3. Levelek maximális száma fánként: A bármely fában létre lehet hozható terminálcsomópontok (levelek) maximális számát jelzi.

    Ennek az értéknek a növelésével növelheti a fa méretét, és nagyobb pontosságot érhet el a túlilledés és a hosszabb betanítás kockázata mellett.

  4. Minták minimális száma levélcsomópontonként: Adja meg a terminálcsomópont (levél) fastruktúrában való létrehozásához szükséges esetek minimális számát.

    Ennek az értéknek a növelésével megnöveli az új szabályok létrehozásának küszöbértékét. Például az alapértelmezett 1 értékkel akár egyetlen eset is létrehozhat egy új szabályt. Ha 5-re növeli az értéket, a betanítás adatainak legalább 5 olyan esetet kell tartalmazni, amelyek ugyanazoknak a feltételeknek felelnie.

  5. Tanulás sebesség: Írjon be egy 0 és 1 közötti számot, amely meghatározza a lépés méretét a tanulás közben. A tanulási sebesség határozza meg, hogy a tanuló milyen gyorsan vagy lassan konvergál az optimális megoldásra. Ha a lépés mérete túl nagy, előfordulhat, hogy túl magas az optimális megoldás. Ha a lépés mérete túl kicsi, a betanítás hosszabb időt vesz igénybe a legjobb megoldás összeváltatása.

  6. A létrehozott fák száma: Az együttesen létrehozatni szükséges döntési fák teljes számát jelzi. Több döntési fa létrehozásával jobb lefedettséget kaphat, de a betanítás ideje nő.

    Ez az érték a betanított modell vizualizációjakor megjelenített fák számát is szabályozza. Ha látni vagy kinyomtatni szeretne egy befát, beállíthatja az értéket 1-re; Ez azonban azt jelenti, hogy csak egy fa lesz előállítva (a kezdeti paraméterkészletet megszabadó fa), és nem történik további iteráció.

  7. Véletlenszám-kezdőérték: Írjon be egy nem kötelező nem negatív egész számot, amely véletlenszerű kezdőértékként használható. A magok megadása biztosítja a reprodukálhatóságot minden olyan futtatás esetében, amelyek ugyanazokkal az adatokkal és paraméterekkel rendelkezik.

    Alapértelmezés szerint a véletlenszerű kezdőérték 0 értékre van állítva, ami azt jelenti, hogy a kezdeti kezdőérték a rendszerórából van lekért érték.

  8. Ismeretlen kategorikus szintek engedélyezése: Ezzel a beállítással csoportot hozhat létre a betanítás és az ellenőrzési készlet ismeretlen értékeihez. Ha nem választja ki ezt a beállítást, a modell csak a betanítás adataiban szereplő értékeket tudja elfogadni. Előfordulhat, hogy a modell kevésbé pontos az ismert értékek esetében, de jobb előrejelzéseket biztosít az új (ismeretlen) értékekhez.

  9. Adjon hozzá egy betanítás adatkészletet és egy betanító modult:

    Megjegyzés

    Ha paramétertartományt ad át a Modell betanítása számára, az csak az első értéket használja a paramétertartományok listájában.

    Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása modulnak, és az egyes paraméterekhez egy beállítástartományt vár, az figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanulóhoz.

    Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, a rendszer ezt az értéket használja a teljes tartományban, még akkor is, ha más paraméterek változnak egy értéktartományban.

  10. Futtassa a kísérletet.

Results (Eredmények)

A betanítás befejezése után:

  • Az egyes iterációkban létrehozott fa megjelenítéséhez kattintson a jobb gombbal a Modell betanítási modulja elemre, és válassza a Betanított modell lehetőséget a vizualizációhoz. Ha a Modell hiperparaméterek hangolása lehetőséget használja, kattintson a jobb gombbal a modulra, és válassza a Betanított legjobb modell lehetőséget a legjobb modell megjelenítéséhez.

    Kattintson az egyes fákra a felosztások részletezésében, és tekintse meg az egyes csomópontok szabályait.

  • Ahhoz, hogy a modellt pontozáshoz használjuk, csatlakoztassa a Score Model (Modell pontozása) pontozáshoz, hogy előrejelezni tudja az új bemeneti példák értékeit.

  • A betanított modell pillanatképének mentéséhez kattintson a jobb gombbal a betanítás modul Betanított modell kimenetére, és válassza a Mentés másként lehetőséget. A elmentett betanított modell másolata nem frissül a kísérlet egymást követő futtatásaikor.

Példák

A kiemelt fák gépi tanulásban való használatára vonatkozó példákért lásd a Azure AI Gallery:

  • Igénybecslés: A Boosted Decision Tree Regression (Döntési fa regressziója) segítségével előrejelzi egy adott időszakra vonatkozó kölcsönzések számát.

  • Twitter-hangulatelemzés: Regresszió segítségével előrejelzhető értékelést hoz létre.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.

Tipp

Általánosságban elmondható, hogy a döntési fák jobb eredményeket hoznak, ha a jellemzők valamelyest kapcsolódnak egymáshoz. Ha a jellemzők nagy fokú energikusak (azaz nem kapcsolódnak egymáshoz), akkor kevés információt osztnak meg egymással, vagy egyáltalán nem osztják meg egymást, és nem rendelik őket egy fába, ami nagy prediktív jelentőséggel bír.

Megvalósítás részletei

A fák együttesét a számítástechnika minden lépésnél egy regressziós fa adja, amely megközelíti a veszteségfok színátmenetét, és hozzáadja az előző fához olyan együtthatókkal, amelyek minimalizálják az új fa elvesztését. A MART által egy adott példányon előállított együttes kimenete a fakimenetek összege.

  • Bináris besorolási probléma esetén a kimenetet a rendszer valószínűségre konvertálja valamilyen formában történő fertőzés használatával.

  • Regressziós problémák esetén a kimenet a függvény előrejeles értéke.

  • Rangsorolási problémák esetén a példányok az együttes kimeneti értéke szerint vannak megrendelve.

Modulparaméterek

Name Tartomány Típus Alapértelmezett Description
Levelek maximális száma fánként >=1 Egész szám 20 A levelek maximális számának megadása fánként
Minták minimális száma levélcsomópontonként >=1 Egész szám 10 A levélcsomóponthoz szükséges esetek minimális számának megadása
Tanulási sebesség [double. Epsilon;1.0] Float 0,2 A kezdeti tanulási sebesség megadása
A felépített fák teljes száma >=1 Egész szám 100 Adja meg a betanítás során létrehozható fák maximális számát
Véletlenszerű szám kezdőszáma bármelyik Egész szám Adja meg a modell által használt véletlenszám-generátor kezdőszámát. Hagyja üresen az alapértelmezett értéket.
Ismeretlen kategorikus szintek engedélyezése bármelyik Logikai true Ha igaz, hozzon létre egy további szintet minden kategorikus oszlophoz. A tesztadatkészletnek a betanítás adatkészletében nem elérhető szintjei erre a további szintre vannak leképezve.

Kimenetek

Név Típus Description
Nem képezett modell ILearner interfész Nem korlátozott regressziós modell

Lásd még

A-Z modullista
Regresszió