Megosztás a következőn keresztül:


Többosztályos döntési erdő összetevő

Ez a cikk az Azure Machine Learning designer egy összetevőjét ismerteti.

Ezzel az összetevővel létrehozhat egy gépi tanulási modellt a döntési erdő algoritmusa alapján. A döntési erdő egy olyan együttes modell, amely gyorsan hoz létre döntési fákat, miközben tanul a címkézett adatokból.

További információ a döntési erdőkről

A döntési erdő algoritmusa egy együttes tanulási módszer a besoroláshoz. Az algoritmus úgy működik, hogy több döntési fát hoz létre, majd a legnépszerűbb kimeneti osztályra szavaz . A szavazás az aggregáció egy formája, amelyben a besorolási döntési erdő minden fája nem normalizált gyakoriságú hisztogramot ad ki a címkékből. Az aggregációs folyamat összegzi ezeket a hisztogramokat, és normalizálja az eredményt, hogy az egyes címkék "valószínűségeit" megkapja. A nagy előrejelzési megbízhatóságú fák nagyobb súlyt adnak az együttes végső döntésében.

A döntési fák általában nem parametrikus modellek, ami azt jelenti, hogy változatos eloszlású adatokat támogatnak. Minden fán egyszerű tesztek sorozata fut az egyes osztályokhoz, növelve a faszerkezet szintjét, amíg el nem éri a levélcsomópontot (döntés).

A döntési fáknak számos előnye van:

  • Ezek nem lineáris döntési határokat jelölhetnek.
  • Hatékonyak a számításban és a memóriahasználatban a betanítás és az előrejelzés során.
  • Integrált funkciók kiválasztását és besorolását végzik.
  • Zajos funkciók jelenlétében rugalmasak.

Az Azure Machine Learning döntési erdő osztályozója döntési fákból áll. Az együttes modellek általában jobb lefedettséget és pontosságot biztosítanak, mint az egyetlen döntési fák. További információ: Döntési fák.

Többosztályos döntési erdő konfigurálása

  1. Adja hozzá a többosztályos döntési erdő összetevőt a folyamathoz a tervezőben. Ezt az összetevőt a Gépi tanulás, a Modell inicializálása és a Besorolás területen találja.

  2. Kattintson duplán az összetevőre a Tulajdonságok panel megnyitásához.

  3. A Resampling metódushoz válassza ki az egyes fák létrehozásához használt metódust. A zsákolás vagy a replikáció közül választhat.

    • Zsákolás: A zsákolást bootstrap-összesítésnek is nevezik. Ebben a módszerben minden fát egy új mintán termesztenek, amely úgy jön létre, hogy véletlenszerűen mintavételezi az eredeti adathalmazt helyettesítővel, amíg nem rendelkezik az eredeti adathalmaz méretével. A modellek kimeneteit szavazással kombináljuk, amely az összesítés egy formája. További információt a Bootstrap-összesítés wikipédiában talál.

    • Replikálás: A replikáció során minden fa pontosan ugyanazokat a bemeneti adatokat tanítja be. Az egyes facsomópontokhoz használt felosztási predikátum meghatározása véletlenszerű marad, és változatos fákat hoz létre.

  4. A Modell betanításának módját a Tréner mód létrehozása beállítással adhatja meg.

    • Egyetlen paraméter: Válassza ezt a lehetőséget, ha tudja, hogyan szeretné konfigurálni a modellt, és adjon meg argumentumként egy értékkészletet.

    • Paramétertartomány: Válassza ezt a lehetőséget, ha nem biztos a legjobb paraméterekben, és paraméter-takarítást szeretne futtatni. Válasszon ki egy értéktartományt, és a Modell hiperparamétereinek finomhangolása a megadott beállítások összes lehetséges kombinációját átterjedve határozza meg az optimális eredményt eredményező hiperparamétereket.

  5. Döntési fák száma: Írja be az együttesben létrehozható döntési fák maximális számát. További döntési fák létrehozásával jobb lefedettséget érhet el, de a betanítási idő megnőhet.

    Ha az értéket 1 értékre állítja; Ez azonban azt jelenti, hogy csak egy fa állítható elő (a kezdeti paraméterkészlettel rendelkező fa), és nem végeznek további iterációkat.

  6. A döntési fák maximális mélysége: Írjon be egy számot a döntési fák maximális mélységének korlátozásához. A fa mélységének növelése növelheti a pontosságot, a túlillesztés és a megnövekedett betanítási idő kockázatával.

  7. Csomópontonkénti véletlenszerű felosztások száma: Írja be a fa egyes csomópontjainak létrehozásakor használni kívánt felosztások számát. A felosztás azt jelenti, hogy a fa (csomópont) egyes szintjei véletlenszerűen vannak elosztva.

  8. Levélcsomópontonkénti minták minimális száma: A fa bármely terminálcsomópont (levél) létrehozásához szükséges esetek minimális száma. Az érték növelésével megnövelheti az új szabályok létrehozásának küszöbértékét.

    Ha például az alapértelmezett érték 1, akár egyetlen esettel is létrejön egy új szabály. Ha az értéket 5-re növeli, a betanítási adatoknak legalább öt, azonos feltételeknek megfelelő esetet kell tartalmazniuk.

  9. Csatlakoztassa a címkézett adatkészletet, és tanítsa be a modellt:

    Megjegyzés

    Ha paramétertartományt ad át a Modell betanítása szolgáltatásnak, az csak az egyetlen paraméterlistában szereplő alapértelmezett értéket használja.

    Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása összetevőnek, amikor az az egyes paraméterekre vonatkozó beállítástartományt vár, figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanulóhoz.

    Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az adott értéket használja a takarítás során, még akkor is, ha más paraméterek egy értéktartományon belül változnak.

  10. Küldje el a folyamatot.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .