Megosztás a következőn keresztül:


Gyors erdő típusú kvantilis regresszió

Ez a cikk az Azure Machine Tanulás tervező egy modulját ismerteti.

Ezzel az összetevővel gyors erdők mennyiségi regressziós modelljét hozhatja létre egy folyamatban. A gyors erdők kvantilis regressziója akkor hasznos, ha többet szeretne megtudni az előrejelzett érték eloszlásáról ahelyett, hogy egyetlen átlagos előrejelzési értéket kapna. Ez a módszer számos alkalmazást tartalmaz, többek között a következőket:

  • Az árak előrejelzése

  • Tanulói teljesítmény becslése vagy növekedési diagramok alkalmazása a gyermekfejlesztés értékeléséhez

  • Prediktív kapcsolatok felderítése olyan esetekben, amikor csak gyenge kapcsolat áll fenn a változók között

Ez a regressziós algoritmus egy felügyelt tanulási módszer, ami azt jelenti, hogy címkeoszlopot tartalmazó címkézett adatkészletre van szükség. Mivel ez egy regressziós algoritmus, a címkeoszlopnak csak numerikus értékeket kell tartalmaznia.

További információ a kvantilis regresszióról

A regressziónak számos különböző típusa van. Egyszerűen fogalmazva, a regresszió azt jelenti, hogy egy modellt numerikus vektorként kifejezett célhoz illesztünk. A statisztikusok azonban egyre fejlettebb regressziós módszereket fejlesztettek ki.

A kvantilis legegyszerűbb definíciója egy olyan érték, amely egy adathalmazt egyenlő méretű csoportokra oszt; így a kvantilis értékek a csoportok közötti határokat jelölik. Statisztikailag kifejezve a kvantilisek olyan értékek, amelyeket egy véletlenszerű változó eloszlásfüggvényének (CDF) inverzéből vett rendszeres időközönként veszünk fel.

Míg a lineáris regressziós modellek egyetlen becsléssel próbálják megjósolni egy numerikus változó értékét, a középértéket, néha a célváltozó tartományát vagy teljes eloszlását kell előrejelezni. Erre a célra olyan technikákat fejlesztettek ki, mint a Bayes-regresszió és a kvantilis regresszió.

A kvantilis regresszió segít megérteni az előrejelzett érték eloszlását. A faalapú kvantilis regressziós modellek, például az ebben az összetevőben használt modellek további előnye, hogy nem parametrikus eloszlások előrejelzésére használhatók.

Fast Forest Quantile Regresszió konfigurálása

  1. Adja hozzá a Fast Forest Quantile Regression összetevőt a folyamathoz a tervezőben. Ezt az összetevőt a Gépi Tanulás Algoritmusok területen találja a Regresszió kategóriában.

  2. A Fast Forest Quantile Regression összetevő jobb oldali ablaktábláján adja meg, hogyan szeretné betanításra használni a modellt a Kiképző létrehozása mód beállításával.

    • Egyetlen paraméter: Ha tudja, hogyan szeretné konfigurálni a modellt, adjon meg egy adott értékhalmazt argumentumként. A modell betanításakor használja a Modell betanítása parancsot.

    • Paramétertartomány: Ha nem biztos a legjobb paraméterekben, végezze el a paraméter-átvizsgálást a Modell hiperparamétereinek finomhangolása összetevővel. A tréner több megadott értéken is iterál, hogy megtalálja az optimális konfigurációt.

  3. A Fák száma mezőbe írja be az együttesben létrehozható fák maximális számát. Ha több fát hoz létre, az általában nagyobb pontosságot eredményez, de hosszabb betanítási idő árán.

  4. A levelek száma, írja be a levelek vagy terminálcsomópontok maximális számát, amelyek bármely fán létrehozhatók.

  5. A levél létrehozásához szükséges képzési példányok minimális száma, adja meg a fa bármely terminálcsomópontjának (levélének) létrehozásához szükséges példák minimális számát.

    Az érték növelésével növeli az új szabályok létrehozásának küszöbértékét. Ha például az alapértelmezett érték 1, akkor akár egyetlen eset is létrehozhat egy új szabályt. Ha az értéket 5-re növeli, a betanítási adatoknak legalább 5 olyan esetet kell tartalmazniuk, amelyek megfelelnek az azonos feltételeknek.

  6. A kódrészletet 0 és 1 közötti számmal adja meg, amely az egyes kvantiliscsoportok létrehozásakor használandó minták töredékét jelöli. A mintákat véletlenszerűen választjuk ki, helyettesítéssel.

  7. Tört felosztása: írjon be egy 0 és 1 közötti számot, amely a fa egyes felosztásaiban használandó funkciók törtrészét jelöli. A használt funkciók mindig véletlenszerűen vannak kiválasztva.

  8. A becsülendő kvantilisek pontosvesszővel elválasztott listáját írja be azoknak a kvantiliseknek a listájához, amelyekhez a modell előrejelzéseket szeretne betaníteni és létrehozni.

    Ha például egy kvartilisekre becsült modellt szeretne létrehozni, írja be a következőt 0.25; 0.5; 0.75: .

  9. Ha szeretné, írjon be egy értéket a véletlenszám-maghoz a modell által használt véletlenszerű számgenerátor kivetéséhez. Az alapértelmezett érték 0, ami azt jelenti, hogy véletlenszerű magot választunk ki.

    Értéket kell adnia, ha az eredményeket ugyanazon adatok egymást követő futtatásai között kell reprodukálnia.

  10. Csatlakozás a betanítási adatkészletet és a nem betanított modellt az egyik betanítási összetevőre:

    • Ha a Kiképző létrehozása módot egyetlen paraméterre állítja, használja a Modell betanítása összetevőt.

    • Ha paramétertartományra állítja a Kiképző létrehozása módot, használja a Modell hiperparamétereinek finomhangolása összetevőt.

    Figyelmeztetés

    • Ha paramétertartományt ad át a modell betanítása gombra, az csak a paramétertartomány-lista első értékét használja.

    • Ha egyetlen paraméterértéket ad át a Modell hiperparaméterek hangolása összetevőnek, amikor az egyes paraméterekhez egy beállítástartományt vár, figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanuló számára.

    • Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer a takarítás során az ön által megadott egyetlen értéket használja, még akkor is, ha más paraméterek egy értéktartományon belül változnak.

  11. Küldje el a folyamatot.

Results (Eredmények)

A betanítás befejezése után:

  • A betanított modell pillanatképének mentéséhez válassza ki a betanítási összetevőt, majd váltson a jobb oldali panel Kimenetek+naplók lapjára. Kattintson az ikonra : Adatkészlet regisztrálása. A mentett modellt összetevőként az összetevőfán találja.

Értékelési metrikák

A Modell kiértékelése összetevő használatával kiértékelheti a betanított modellt. A Fast Forest Quantile Regresszió esetében a metrikák a következők.

  • Kvantilis veszteség: Ez a modell egy adott kvantilisének hibájának mértéke.
  • Átlagos kvantilis veszteség: Ez egyszerűen a kvantilis veszteség értékeinek átlaga a modellben figyelembe vett összes kvantitóban. Átfogó képet ad arról, hogy a modell milyen jól teljesít az összes kvantilisben.

Következő lépések

Tekintse meg az Azure Machine Tanulás számára elérhető összetevőket.