Többosztályos döntési erdő összetevő
Ez a cikk az Azure Machine Learning designer egy összetevőjét ismerteti.
Ezzel az összetevővel létrehozhat egy gépi tanulási modellt a döntési erdő algoritmusa alapján. A döntési erdő egy olyan együttes modell, amely gyorsan létrehoz egy sor döntési fát, miközben a címkézett adatokból tanul.
További információ a döntési erdőkről
A döntési erdő algoritmusa a besorolás együttes tanulási módszere. Az algoritmus úgy működik, hogy több döntési fát hoz létre, majd a legnépszerűbb kimeneti osztályra szavaz . A szavazás az aggregáció egyik formája, amelyben a besorolási döntési erdő minden fája a címkék nem normalizált gyakoriságú hisztogramját adja ki. Az aggregációs folyamat összegzi ezeket a hisztogramokat, és normalizálja az eredményt, hogy lekérje az egyes címkék "valószínűségeit". A magas előrejelzési megbízhatóságú fák nagyobb súlyt bírnak az együttes végső döntésében.
A döntési fák általában nem parametrikus modellek, ami azt jelenti, hogy változatos eloszlású adatokat támogatnak. Minden egyes fán egyszerű tesztek sorozata fut az egyes osztályokhoz, növelve a faszerkezet szintjét, amíg el nem éri a levélcsomópontot (döntés).
A döntési fáknak számos előnye van:
- Ezek nem lineáris döntési határokat jelölhetnek.
- Hatékonyak a számításokban és a memóriahasználatban a betanítás és az előrejelzés során.
- Integrált funkciók kiválasztását és besorolását végzik el.
- Zajos funkciók jelenlétében rugalmasak.
Az Azure Machine Learning döntési erdő osztályozója döntési fákból áll. Az együttesmodellek általában jobb lefedettséget és pontosságot biztosítanak, mint az önálló döntési fák. További információ: Döntési fák.
Többosztályos döntési erdő konfigurálása
Adja hozzá a többosztályos döntési erdő összetevőt a folyamathoz a tervezőben. Ezt az összetevőt a Machine Learning, a Modell inicializálása és a Besorolás területen találja.
Kattintson duplán az összetevőre a Tulajdonságok panel megnyitásához.
Az Újraampling metódushoz válassza ki az egyes fák létrehozásához használt metódust. A zsákolás vagy a replikáció közül választhat.
Zsákolás: A zsákolást bootstrap-összesítésnek is nevezik. Ebben a módszerben minden fa egy új mintán nő, és úgy jön létre, hogy véletlenszerűen mintavételezi az eredeti adathalmazt helyettesítővel, amíg nem rendelkezik az eredeti méretű adatkészlettel. A modellek kimeneteit szavazással kombináljuk, ami az összesítés egy formája. További információkért lásd a Bootstrap-összesítés Wikipédiában található bejegyzését.
Replikálás: A replikáció során minden fa pontosan ugyanazokra a bemeneti adatokra van betanítve. Az egyes facsomópontokhoz használt felosztási predikátum meghatározása véletlenszerű marad, és sokszínű fákat hoz létre.
Adja meg a modell betanításának módját a Kiképző létrehozása mód beállításával.
Egyetlen paraméter: Válassza ezt a lehetőséget, ha tudja, hogyan szeretné konfigurálni a modellt, és adjon meg egy értékhalmazt argumentumként.
Paramétertartomány: Válassza ezt a lehetőséget, ha nem biztos a legjobb paraméterekben, és szeretne paraméter-takarítást futtatni. Válasszon ki egy iterátumhoz szükséges értéktartományt, és a modell hiperparamétereinek finomhangolása a megadott beállítások összes lehetséges kombinációját átszűri az optimális eredményt eredményező hiperparaméterek meghatározásához.
Döntési fák száma: Írja be az együttesben létrehozható döntési fák maximális számát. További döntési fák létrehozásával jobb lefedettséget érhet el, de a betanítási idő nőhet.
Ha az értéket 1 értékre állítja; Ez azonban azt jelenti, hogy csak egy fa állítható elő (a kezdeti paraméterkészlettel rendelkező fa), és nincs további iteráció.
A döntési fák maximális mélysége: Írjon be egy számot a döntési fák maximális mélységének korlátozásához. A fa mélységének növelése növelheti a pontosságot, a túlillesztés és a megnövekedett betanítási idő kockázatával.
Csomópontonkénti véletlenszerű felosztások száma: Írja be a fa egyes csomópontjainak létrehozásakor használandó felosztások számát. A felosztás azt jelenti, hogy a fa (csomópont) egyes szintjei véletlenszerűen vannak elosztva.
Levélcsomópontonkénti minták minimális száma: A fa bármely terminálcsomópontjának (levélének) létrehozásához szükséges esetek minimális száma. Az érték növelésével növeli az új szabályok létrehozásának küszöbértékét.
Ha például az alapértelmezett érték 1, akkor akár egyetlen eset is létrehozhat egy új szabályt. Ha az értéket 5-re növeli, a betanítási adatoknak legalább öt, azonos feltételeknek megfelelő esetet kell tartalmazniuk.
Csatlakoztassa a címkézett adatkészletet, és tanítsa be a modellt:
Ha a Kiképző létrehozása módot egyetlen paraméterre állítja, csatlakoztassa a címkézett adatkészletet és a Modell betanítása összetevőt.
Ha paramétertartományra állítja a Kiképző létrehozása módot, csatlakoztassa a címkézett adatkészletet, és betanítsa a modellt a modell hiperparamétereinek finomhangolásával.
Feljegyzés
Ha paramétertartományt ad át a modell betanítása gombra, az csak az egyetlen paraméterlistában szereplő alapértelmezett értéket használja.
Ha egyetlen paraméterértéket ad át a Modell hiperparaméterek hangolása összetevőnek, amikor az egyes paraméterekhez egy beállítástartományt vár, figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanuló számára.
Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer a takarítás során az ön által megadott egyetlen értéket használja, még akkor is, ha más paraméterek egy értéktartományon belül változnak.
Küldje el a folyamatot.
Következő lépések
Tekintse meg az Azure Machine Learning számára elérhető összetevőket.