Döntési erdő típusú regresszió
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Regressziós modellt hoz létre a döntési erdő algoritmusával
Kategória: Modell inicializálása – Regresszió
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használható a decision forest regression (döntési erdőregresszió) modul a Machine Learning Studio (klasszikus) alkalmazásában a döntési fák együttese alapján létrehozott regressziós modell létrehozásához.
A modell konfigurálása után címkével jelölt adatkészlet és a Modell betanítása modul használatával kell betanítnia a modellt. A betanított modell ezután előrejelzésekhez használható. Másik lehetőségként a nem képezett modell át is átvitele a Modell keresztellenőrzése számára a címkézett adathalmazok keresztellenőrzése érdekében.
A döntési erdők a regressziós feladatokban
A döntési fák nem parametrikus modellek, amelyek egyszerű tesztek sorozatát hajtsák végre az egyes példányok esetében, és a levélcsomópontig (döntésig) áthaladnak egy bináris faszerkezeten.
A döntési fák az alábbi előnyökkel járnak:
A betanítás és az előrejelzés során mind a számítás, mind a memóriahasználat terén hatékonyak.
Ezek nem lineáris döntési határokat jelenthetnek.
Integrált jellemzők kiválasztását és besorolását végezik el, és zajos jellemzők esetén is rugalmasak.
Ez a regressziós modell döntési fák együttesét tartalmazza. A regressziós döntési erdő minden fája előrejelzésként egy Bizonyos Gauss-eloszlást ad vissza. A rendszer a fák együttesén végez összesítést, hogy megkeressen egy, a modellben lévő összes fa kombinált eloszlásával legközelebb eső Gauss-elosztást.
Az algoritmus elméleti keretrendszerével és annak megvalósításával kapcsolatos további információkért tekintse meg a következő cikket: Döntési erdők: Egységes osztályozási, regressziós, sűrűségbecslési keretrendszer, Tanulás és Semi-Supervised Tanulás
Döntési erdő regressziós modelljének konfigurálása
Adja hozzá a Decision Forest Regression (Döntési erdő regressziója) modult a kísérlethez. A modult a (klasszikus) Studióban, a Machine Learning, a Modell inicializálása és a Regresszió alatt találja.
Nyissa meg a modul tulajdonságait, majd az Újrabélyegző metódushoz válassza ki az egyes fák létrehozásához használt metódust. Választhat a Címkézés vagy aReplikálás közül.
Címkézés: A címkézést bootstrap-összesítésnek is nevezik. A regressziós döntési erdő minden fája előrejelzési módszer szerint egy Bizonyos Típusú elosztást ad vissza. Az aggregáció egy Olyan Gauss-belit keres, amelynek első két pillanata megegyezik a Amitss-beliek által adott pár pillanattal, az egyes fák által visszaadott összes EgyesÍtős-személy kombinálásával.
További információért tekintse meg a Bootstrap-aggregációról a Wikipédia-bejegyzést.
Replikálás: A replikáció során minden fa pontosan ugyanazokkal a bemeneti adatokkal van betanítva. Annak meghatározása, hogy a rendszer melyik felosztási predikátumot használja az egyes facsomóponthoz, véletlenszerű marad, és a fák változatosak lesznek.
A Replikálás lehetőséggel végzett betanítási folyamattal kapcsolatos további információkért lásd: Döntési erdők a Computer Vision és orvosi képelemzés. Criminisi és J. Shotton. Springer 2013..
Az Oktatói mód létrehozása lehetőség beállításával adja meg, hogyan szeretné betanítni a modellt.
Egyetlen paraméter
Ha tudja, hogyan szeretné konfigurálni a modellt, argumentumként egy adott értékkészletet is meg lehet adni. Lehet, hogy kísérletezés alapján megtanulta ezeket az értékeket, vagy útmutatásként kapta meg őket.
Paramétertartomány
Ha nem biztos a legjobb paraméterekben, több érték megadásával és paraméteres keresés használatával megkeresheti az optimális konfigurációt.
A Modell-hiperparaméterek hangolása a megadott beállítások összes lehetséges kombinációját iterálni fogja, és meghatározza az optimális eredményeket előállító beállítások kombinációját.
A Döntési fák száma mezőben adja meg az együttesen létrehozni szükséges döntési fák teljes számát. Ha több döntési fát hoz létre, jobb lefedettséget kaphat, de a betanítás ideje nőni fog.
Tipp
Ez az érték a betanított modell vizualizációjakor megjelenített fák számát is szabályozza. Ha egyetlen fát szeretne látni vagy kinyomtatni, beállíthatja az értéket 1-re; Ez azonban azt jelenti, hogy csak egy fa lesz előállítva (a kezdeti paraméterkészletet megszabadó fa), és nem lesz további iteráció.
A döntési fák maximális mélységeként írjon be egy számot a döntési fák maximális mélységének korlátozásához. A fa mélységének növelése növelheti a pontosságot, ami túlilledés és megnövekedett betanítás kockázatával jár.
A Number of random splits per node (Véletlenszerű felosztások száma csomópontonként) mezőbe írja be a fa egyes csomópontok kiépítésekor használt felosztások számát. A felosztás azt jelenti, hogy a fa (csomópont) egyes szintjei véletlenszerűen vannak elosztva.
A Minták minimális száma levélcsomópontonként mezőben adja meg azon esetek minimális számát, amelyek egy fa terminálcsomópontjának (levélcsomópontjának) létrehozásához szükségesek.
Ennek az értéknek a növelésével megnöveli az új szabályok létrehozásának küszöbértékét. Például az alapértelmezett 1 értékkel akár egyetlen eset is létrehozhat egy új szabályt. Ha 5-re növeli az értéket, a betanítás adatainak legalább 5 olyan esetet kell tartalmazni, amelyek ugyanazoknak a feltételeknek felelnie.
Válassza az Ismeretlen értékek engedélyezése kategorikus funkciókhoz lehetőséget, hogy csoportot hozzon létre a betanítás vagy az ellenőrzési készlet ismeretlen értékeihez.
Ha a kijelölést nem, a modell csak a betanítás adataiban szereplő értékeket tudja elfogadni. A korábbi esetben a modell kevésbé lesz pontos az ismert értékekhez, de jobb előrejelzéseket biztosít az új (ismeretlen) értékekhez.
Csatlakozás válasszon ki egy címkével jelölt oszlopot, amely legfeljebb két kimenetet tartalmaz, és kösse össze a Modell betanítása vagy a Modell hiperparaméterének hangolása lehetőséget.
Ha az Oktató létrehozása módot Egyparaméteresre, a Modell betanítása modullal betanítja a modellt.
Ha az oktatói mód létrehozása paramétertartományt ad meg, a modell betanítása a Modell hiperparaméterek hangolása funkcióval lehetséges.
Futtassa a kísérletet.
Results (Eredmények)
A betanítás befejezése után:
Az egyes iterációkban létrehozott fa megjelenítéséhez kattintson a jobb gombbal a betanítási modul kimenetére, és válassza a Képi megjelenítés lehetőséget.
Az egyes csomópontok szabályait úgy láthatja, ha az egyes fákra kattint, és részletezi a felosztásokat.
A betanított modell pillanatképének mentéséhez kattintson a jobb gombbal a betanítás modul kimenetére, majd válassza a Mentés betanított modellként lehetőséget. A modellnek ez a másolata nem frissül a kísérlet egymást követő futtatásaikor.
Példák
A regressziós modellekre vonatkozó példákért tekintse meg ezeket a mintakísérleteket a Cortana Intelligence Galleryben:
Regressziós modellek összehasonlítása minta: Több különböző típusú regressziós modell kontrasztja.
Hangulatelemzési minta: Több különböző regressziós modellel hoz létre előrejeles értékeléseket.
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.
Ha paramétertartományt ad át a Modell betanítása számára, az csak az első értéket fogja használni a paramétertartományok listájában.
Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása modulnak, és az egyes paraméterekhez egy beállítástartományt vár, az figyelmen kívül hagyja az értékeket, és a tanuló alapértelmezett értékeit használja.
Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, a rendszer ezt az egyetlen értéket fogja használni a teljes átvizsgálás során, még akkor is, ha más paraméterek változnak egy értéktartományban.
Használati tippek
Ha korlátozott mennyiségű adat áll rendelkezésre, vagy szeretné minimálisra csökkenteni a modell betanításán töltött időt, próbálja meg a következő beállításokat:
Korlátozott betanítás. Ha a betanítás készlet korlátozott számú példányt tartalmaz:
A döntési erdő létrehozása nagy számú döntési fával (például több mint 20)
A Címkézés lehetőség használata az újrabélyegzéshez
Adjon meg nagy számú véletlenszerű felosztást csomópontonként (például több mint 1000)
Korlátozott betanítás. Ha a betanítás készlete sok példányt tartalmaz, és a betanítás ideje korlátozott:
A döntési erdő létrehozása kevesebb döntési fával (például 5–10)
A Replikálás lehetőség használata az újrabélyegezéshez
Adjon meg néhány véletlenszerű felosztást csomópontonként (például kevesebb mint 100)
Modulparaméterek
Name | Tartomány | Típus | Alapértelmezett | Description |
---|---|---|---|---|
Újrabélyegző metódus | bármelyik | ResamplingMethod | Zsákoló | Újrabélyegző módszer kiválasztása |
Döntési fák száma | >=1 | Egész szám | 8 | Adja meg, hogy hány döntési fát hozzon létre az együttesben |
A döntési fák maximális mélysége | >=1 | Egész szám | 32 | Adja meg az együttesen létrehozható döntési fák maximális mélységét |
Véletlenszerű felosztások száma csomópontonként | >=1 | Egész szám | 128 | Adja meg a csomópontonként generált felosztások számát, amelyekből az optimális felosztás van kiválasztva |
Minták minimális száma levélcsomópontonként | >=1 | Egész szám | 1 | Adja meg a levélcsomópont létrehozásához szükséges betanításminták minimális számát |
Ismeretlen értékek engedélyezése kategorikus jellemzők számára | bármelyik | Logikai | true | Annak jelzése, hogy a meglévő kategorikus jellemzők ismeretlen értékei leképezése lehetséges-e egy új, további funkcióra |
Kimenetek
Név | Típus | Description |
---|---|---|
Nem képezett modell | ILearner interfész | Nem korlátozott regressziós modell |