Megosztás a következőn keresztül:


Döntési erdő regressziós összetevője

Ez a cikk az Azure Machine Learning-tervező egy összetevőjét ismerteti.

Ezzel az összetevővel hozzon létre egy regressziós modellt döntési fák együttese alapján.

A modell konfigurálása után be kell tanítania a modellt egy címkézett adatkészlet és a Modell betanítása összetevő használatával. A betanított modell ezután előrejelzések készítésére használható.

Működés

A döntési fák nem parametrikus modellek, amelyek minden példány esetében egyszerű tesztek sorozatát hajtják végre, és egy bináris fa adatszerkezetén haladnak végig, amíg el nem éri a levélcsomópontot (döntés).

A döntési fáknak az alábbi előnyei vannak:

  • Hatékonyak a számításban és a memóriahasználatban is a betanítás és az előrejelzés során.

  • Ezek nem lineáris döntési határokat jelölhetnek.

  • Integrált funkciók kiválasztását és besorolását végzik, és zajos funkciók jelenlétében rugalmasak.

Ez a regressziós modell döntési fákból áll. A regressziós döntési erdő minden fája gauss-eloszlást ad előrejelzésként. A rendszer a facsoportokon keresztül végez összesítést, hogy megtalálja a modellben szereplő összes fa együttes eloszlásához legközelebb eső Gauss-eloszlást.

Az algoritmus elméleti keretrendszerével és implementálásával kapcsolatos további információkért lásd a következő cikket: Decision Forests: A Unified Framework for Classification, Regression, Density Estimation, Manifold Learning and Semi-Supervised Learning

Döntési erdő regressziós modelljének konfigurálása

  1. Adja hozzá a Decision Forest Regression összetevőt a folyamathoz. Az összetevőt a tervezőben a Gépi tanulás, a Modell inicializálása és a Regresszió területen találja.

  2. Nyissa meg az összetevő tulajdonságait, és a Resampling metódushoz válassza ki az egyes fák létrehozásához használt metódust. Választhat a Zsákolás vagy a Replikálás lehetőség közül.

    • Zsákolás: A zsákolást bootstrap-összesítésnek is nevezik. A regressziós döntési erdő minden fája gauss-eloszlást ad ki előrejelzéssel. Az aggregáció egy olyan Gauss-példány megkeresése, amelynek első két pillanata megegyezik a Gauss-eloszlások egyesítése által visszaadott összes eloszlás egyesítésével megadott gaussai eloszlások pillanataihoz.

      További információt a Bootstrap aggregáció wikipédiával kapcsolatos bejegyzésében talál.

    • Replikálás: A replikáció során minden fa pontosan ugyanazokon a bemeneti adatokon van betanulva. Az egyes facsomópontokhoz használt felosztási predikátum meghatározása véletlenszerű marad, és a fák változatosak lesznek.

      A Replikálás beállítás betanítási folyamatával kapcsolatos további információkért lásd: Decision Forests for Computer Vision and Medical Image Analysis (Döntési erdők Computer Vision és Orvosi képelemzés). Criminisi és J. Shotton. Springer 2013..

  3. A Modell betanításának módját az Oktatói mód létrehozása beállítással adhatja meg.

    • Egyetlen paraméter

      Ha tudja, hogyan szeretné konfigurálni a modellt, argumentumként megadhat egy adott értékkészletet. Előfordulhat, hogy kísérletezéssel tanulta meg ezeket az értékeket, vagy útmutatásként kapta őket.

    • Paramétertartomány: Válassza ezt a lehetőséget, ha nem biztos a legjobb paraméterekben, és paraméteres takarítást szeretne futtatni. Válasszon ki egy értéktartományt, amelyet újra kell iterálni, és a Modell hiperparamétereinek finomhangolása a megadott beállítások összes lehetséges kombinációját végigterjedve határozza meg az optimális eredményt eredményező hiperparamétereket.

  4. A Döntési fák száma területen adja meg az együttesben létrehozandó döntési fák teljes számát. További döntési fák létrehozásával jobb lefedettséget érhet el, de a betanítási idő nőni fog.

    Tipp

    Ha az értéket 1-re állítja; Ez azonban azt jelenti, hogy csak egy fa lesz létrehozva (a kezdeti paraméterkészlettel rendelkező fa), és további iterációk nem lesznek végrehajtva.

  5. A döntési fák maximális mélysége mezőbe írjon be egy számot a döntési fák maximális mélységének korlátozásához. A fa mélységének növelése növelheti a pontosságot, ha a túlillesztés és a betanítási idő megnő.

  6. A Csomópontonkénti véletlenszerű felosztások száma mezőbe írja be a fa egyes csomópontjainak létrehozásakor használandó felosztások számát. A felosztás azt jelenti, hogy a fa (csomópont) egyes szintjei véletlenszerűen vannak elosztva.

  7. A Levélcsomópontonkénti minták minimális száma területen adja meg, hogy a fa összes terminálcsomópontja (levél) létrehozásához minimálisan hány eset szükséges.

    Az érték növelésével növeli az új szabályok létrehozásának küszöbértékét. Ha például az alapértelmezett érték 1, akár egyetlen esettel is létrejön egy új szabály. Ha az értéket 5-re növeli, a betanítási adatoknak legalább öt, azonos feltételeknek megfelelő esetet kell tartalmazniuk.

  8. A modell betanítása:

    Megjegyzés

    Ha paramétertartományt ad át a Modell betanítása szolgáltatásnak, az csak az egyetlen paraméterlistában szereplő alapértelmezett értéket használja.

    Ha egyetlen paraméterérték-készletet ad át a Modell hiperparamétereinek finomhangolása összetevőnek, amikor az minden paraméterhez egy beállítástartományt vár, figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanuló számára.

    Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az adott értéket használja a takarítás során, még akkor is, ha más paraméterek egy értéktartományon belül változnak.

  9. Küldje el a folyamatot.

Results (Eredmények)

A betanítás befejezése után:

  • A betanított modell pillanatképének mentéséhez válassza ki a betanítási összetevőt, majd váltson a jobb oldali panel Kimenetek lapjára. Kattintson a Modell regisztrálása ikonra. A mentett modell az összetevőfában található összetevőként található.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .