Döntési erdő típusú regresszió

Cikk
05/06/2019

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
További információ a Azure Machine Learning.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Regressziós modellt hoz létre a döntési erdő algoritmusával

Kategória: Modell inicializálása – Regresszió

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a decision forest regression (döntési erdőregresszió) modul a Machine Learning Studio (klasszikus) alkalmazásában a döntési fák együttese alapján létrehozott regressziós modell létrehozásához.

A modell konfigurálása után címkével jelölt adatkészlet és a Modell betanítása modul használatával kell betanítnia a modellt. A betanított modell ezután előrejelzésekhez használható. Másik lehetőségként a nem képezett modell át is átvitele a Modell keresztellenőrzése számára a címkézett adathalmazok keresztellenőrzése érdekében.

A döntési erdők a regressziós feladatokban

A döntési fák nem parametrikus modellek, amelyek egyszerű tesztek sorozatát hajtsák végre az egyes példányok esetében, és a levélcsomópontig (döntésig) áthaladnak egy bináris faszerkezeten.

A döntési fák az alábbi előnyökkel járnak:

A betanítás és az előrejelzés során mind a számítás, mind a memóriahasználat terén hatékonyak.
Ezek nem lineáris döntési határokat jelenthetnek.
Integrált jellemzők kiválasztását és besorolását végezik el, és zajos jellemzők esetén is rugalmasak.

Ez a regressziós modell döntési fák együttesét tartalmazza. A regressziós döntési erdő minden fája előrejelzésként egy Bizonyos Gauss-eloszlást ad vissza. A rendszer a fák együttesén végez összesítést, hogy megkeressen egy, a modellben lévő összes fa kombinált eloszlásával legközelebb eső Gauss-elosztást.

Az algoritmus elméleti keretrendszerével és annak megvalósításával kapcsolatos további információkért tekintse meg a következő cikket: Döntési erdők: Egységes osztályozási, regressziós, sűrűségbecslési keretrendszer, Tanulás és Semi-Supervised Tanulás

Döntési erdő regressziós modelljének konfigurálása

Adja hozzá a Decision Forest Regression (Döntési erdő regressziója) modult a kísérlethez. A modult a (klasszikus) Studióban, a Machine Learning, a Modell inicializálása és a Regresszió alatt találja.
Nyissa meg a modul tulajdonságait, majd az Újrabélyegző metódushoz válassza ki az egyes fák létrehozásához használt metódust. Választhat a Címkézés vagy aReplikálás közül.
- Címkézés: A címkézést bootstrap-összesítésnek is nevezik. A regressziós döntési erdő minden fája előrejelzési módszer szerint egy Bizonyos Típusú elosztást ad vissza. Az aggregáció egy Olyan Gauss-belit keres, amelynek első két pillanata megegyezik a Amitss-beliek által adott pár pillanattal, az egyes fák által visszaadott összes EgyesÍtős-személy kombinálásával.
  
  További információért tekintse meg a Bootstrap-aggregációról a Wikipédia-bejegyzést.
- Replikálás: A replikáció során minden fa pontosan ugyanazokkal a bemeneti adatokkal van betanítva. Annak meghatározása, hogy a rendszer melyik felosztási predikátumot használja az egyes facsomóponthoz, véletlenszerű marad, és a fák változatosak lesznek.
  
  A Replikálás lehetőséggel végzett betanítási folyamattal kapcsolatos további információkért lásd: Döntési erdők a Computer Vision és orvosi képelemzés. Criminisi és J. Shotton. Springer 2013..
Az Oktatói mód létrehozása lehetőség beállításával adja meg, hogyan szeretné betanítni a modellt.
- Egyetlen paraméter
  
  Ha tudja, hogyan szeretné konfigurálni a modellt, argumentumként egy adott értékkészletet is meg lehet adni. Lehet, hogy kísérletezés alapján megtanulta ezeket az értékeket, vagy útmutatásként kapta meg őket.
- Paramétertartomány
  
  Ha nem biztos a legjobb paraméterekben, több érték megadásával és paraméteres keresés használatával megkeresheti az optimális konfigurációt.
  
  A Modell-hiperparaméterek hangolása a megadott beállítások összes lehetséges kombinációját iterálni fogja, és meghatározza az optimális eredményeket előállító beállítások kombinációját.
A Döntési fák száma mezőben adja meg az együttesen létrehozni szükséges döntési fák teljes számát. Ha több döntési fát hoz létre, jobb lefedettséget kaphat, de a betanítás ideje nőni fog.

Tipp

Ez az érték a betanított modell vizualizációjakor megjelenített fák számát is szabályozza. Ha egyetlen fát szeretne látni vagy kinyomtatni, beállíthatja az értéket 1-re; Ez azonban azt jelenti, hogy csak egy fa lesz előállítva (a kezdeti paraméterkészletet megszabadó fa), és nem lesz további iteráció.
A döntési fák maximális mélységeként írjon be egy számot a döntési fák maximális mélységének korlátozásához. A fa mélységének növelése növelheti a pontosságot, ami túlilledés és megnövekedett betanítás kockázatával jár.
A Number of random splits per node (Véletlenszerű felosztások száma csomópontonként) mezőbe írja be a fa egyes csomópontok kiépítésekor használt felosztások számát. A felosztás azt jelenti, hogy a fa (csomópont) egyes szintjei véletlenszerűen vannak elosztva.
A Minták minimális száma levélcsomópontonként mezőben adja meg azon esetek minimális számát, amelyek egy fa terminálcsomópontjának (levélcsomópontjának) létrehozásához szükségesek.

Ennek az értéknek a növelésével megnöveli az új szabályok létrehozásának küszöbértékét. Például az alapértelmezett 1 értékkel akár egyetlen eset is létrehozhat egy új szabályt. Ha 5-re növeli az értéket, a betanítás adatainak legalább 5 olyan esetet kell tartalmazni, amelyek ugyanazoknak a feltételeknek felelnie.
Válassza az Ismeretlen értékek engedélyezése kategorikus funkciókhoz lehetőséget, hogy csoportot hozzon létre a betanítás vagy az ellenőrzési készlet ismeretlen értékeihez.

Ha a kijelölést nem, a modell csak a betanítás adataiban szereplő értékeket tudja elfogadni. A korábbi esetben a modell kevésbé lesz pontos az ismert értékekhez, de jobb előrejelzéseket biztosít az új (ismeretlen) értékekhez.
Csatlakozás válasszon ki egy címkével jelölt oszlopot, amely legfeljebb két kimenetet tartalmaz, és kösse össze a Modell betanítása vagy a Modell hiperparaméterének hangolása lehetőséget.
- Ha az Oktató létrehozása módot Egyparaméteresre, a Modell betanítása modullal betanítja a modellt.
- Ha az oktatói mód létrehozása paramétertartományt ad meg, a modell betanítása a Modell hiperparaméterek hangolása funkcióval lehetséges.
Futtassa a kísérletet.

Results (Eredmények)

A betanítás befejezése után:

Az egyes iterációkban létrehozott fa megjelenítéséhez kattintson a jobb gombbal a betanítási modul kimenetére, és válassza a Képi megjelenítés lehetőséget.
Az egyes csomópontok szabályait úgy láthatja, ha az egyes fákra kattint, és részletezi a felosztásokat.
A betanított modell pillanatképének mentéséhez kattintson a jobb gombbal a betanítás modul kimenetére, majd válassza a Mentés betanított modellként lehetőséget. A modellnek ez a másolata nem frissül a kísérlet egymást követő futtatásaikor.

Példák

A regressziós modellekre vonatkozó példákért tekintse meg ezeket a mintakísérleteket a Cortana Intelligence Galleryben:

Regressziós modellek összehasonlítása minta: Több különböző típusú regressziós modell kontrasztja.
Hangulatelemzési minta: Több különböző regressziós modellel hoz létre előrejeles értékeléseket.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.

Ha paramétertartományt ad át a Modell betanítása számára, az csak az első értéket fogja használni a paramétertartományok listájában.
Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása modulnak, és az egyes paraméterekhez egy beállítástartományt vár, az figyelmen kívül hagyja az értékeket, és a tanuló alapértelmezett értékeit használja.
Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, a rendszer ezt az egyetlen értéket fogja használni a teljes átvizsgálás során, még akkor is, ha más paraméterek változnak egy értéktartományban.

Használati tippek

Ha korlátozott mennyiségű adat áll rendelkezésre, vagy szeretné minimálisra csökkenteni a modell betanításán töltött időt, próbálja meg a következő beállításokat:

Korlátozott betanítás. Ha a betanítás készlet korlátozott számú példányt tartalmaz:

A döntési erdő létrehozása nagy számú döntési fával (például több mint 20)
A Címkézés lehetőség használata az újrabélyegzéshez
Adjon meg nagy számú véletlenszerű felosztást csomópontonként (például több mint 1000)

Korlátozott betanítás. Ha a betanítás készlete sok példányt tartalmaz, és a betanítás ideje korlátozott:

A döntési erdő létrehozása kevesebb döntési fával (például 5–10)
A Replikálás lehetőség használata az újrabélyegezéshez
Adjon meg néhány véletlenszerű felosztást csomópontonként (például kevesebb mint 100)

Modulparaméterek

Name	Tartomány	Típus	Alapértelmezett	Description
Újrabélyegző metódus	bármelyik	ResamplingMethod	Zsákoló	Újrabélyegző módszer kiválasztása
Döntési fák száma	>=1	Egész szám	8	Adja meg, hogy hány döntési fát hozzon létre az együttesben
A döntési fák maximális mélysége	>=1	Egész szám	32	Adja meg az együttesen létrehozható döntési fák maximális mélységét
Véletlenszerű felosztások száma csomópontonként	>=1	Egész szám	128	Adja meg a csomópontonként generált felosztások számát, amelyekből az optimális felosztás van kiválasztva
Minták minimális száma levélcsomópontonként	>=1	Egész szám	1	Adja meg a levélcsomópont létrehozásához szükséges betanításminták minimális számát
Ismeretlen értékek engedélyezése kategorikus jellemzők számára	bármelyik	Logikai	true	Annak jelzése, hogy a meglévő kategorikus jellemzők ismeretlen értékei leképezése lehetséges-e egy új, további funkcióra

Kimenetek

Név	Típus	Description
Nem képezett modell	ILearner interfész	Nem korlátozott regressziós modell

Lásd még

Regresszió

A-Z modullista

Megosztás a következőn keresztül: