Megosztás a következőn keresztül:


Poisson-regresszió

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Létrehoz egy regressziós modellt, amely feltételezi, hogy az adatok eloszlása Poisson-eloszlást tartalmaz

Kategória: Machine Learning / Modell inicializálása /Regresszió

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a Poisson Regression modul a Machine Learning Studióban (klasszikus) Egy Poisson-regressziós modell létrehozásához.

A Poisson-regresszió olyan regressziós modellekben való használatra szolgál, amelyek numerikus értékek , általában számok előrejelzésére szolgálnak. Ezért ezt a modult csak akkor érdemes használnia a regressziós modell létrehozásához, ha a megjósolni próbált értékek a következő feltételekhez illeszkednek:

  • A válaszváltozó rendelkezik Egy Poisson-eloszlásval.

  • A darabszámok nem lehetnek negatívak. A metódus nem fog működni, ha negatív címkékkel próbálja használni.

  • A Poisson-eloszlás különálló eloszlás; ezért nem értelmezhető ezt a metódust nem egész számokkal használni.

Tipp

Ha a cél nem szám, akkor a Poisson-regresszió valószínűleg nem megfelelő módszer. Próbálja ki az egyik másik modult ebben a kategóriában. Ha segítségre van szüksége a regressziós módszer kiválasztása során, tekintse meg a Machine Learning algoritmus-adatlapot.

Miután beállította a regressziós metódust, be kell betaníta a modellt egy olyan adathalmaz használatával, amely példákat tartalmaz az előrejelezni kívánt értékre. A betanított modell ezután előrejelzésekhez használható.

További információk a Poisson-regresszióról

A Poisson-regresszió egy speciális regressziós elemzés, amely jellemzően a modellek darabszámának elemzésére használatos. A Poisson-regresszió például az alábbi helyzetekben lehet hasznos:

  • Repülőjáratokkal társított hideg utak számának modellezése

  • A vészhelyzeti szolgáltatáshívások számának becslése egy esemény során

  • Az előléptetést követő ügyfélkérések számának kivetítése

  • Válságtáblák létrehozása

Mivel a válaszváltozó rendelkezik Poisson-eloszlástal, a modell más feltételezéseket tesz az adatokról és annak valószínűségi eloszlásról, mint például a legkisebb négyzetes regresszióról. Ezért a Poisson-modelleket más regressziós modellektől eltérő módon kell értelmezni.

A Poisson-regresszió konfigurálása

  1. Adja hozzá a Poisson Regression modult a kísérlethez a Studióban (klasszikus).

    Ezt a modult a Regressziókategóriában Machine Learning – Inicializálás alatt találja.

  2. Adjon hozzá egy adatkészletet, amely a megfelelő típusú betanításadatokat tartalmazza.

    Javasoljuk, hogy a regresszió betanítása előtt az Adatok normalizálása használatával normalizálja a bemeneti adatkészletet.

  3. A Poisson Regression modul Tulajdonságok panelén adja meg a modell betanítási módját az Oktatói mód létrehozása lehetőség beállításával.

    • Egyetlen paraméter: Ha tudja, hogyan szeretné konfigurálni a modellt, argumentumként adjon meg egy adott értékkészletet.

    • Paramétertartomány. Ha nem biztos a legjobb paraméterekben, a Modell hiperparaméterek hangolása modullal paraméteres siklikus adatokat kell használnia . Az oktatók több ön által megadott értékkel iterálnak az optimális konfiguráció megtalálása érdekében.

  4. Optimalizálási tűréshatár: Adjon meg egy értéket, amely meghatározza a tűréshatárt az optimalizálás során. Minél alacsonyabb az érték, annál lassabb és pontosabb az illesztés.

  5. L1 regularizációs súly és L2 regularizációs súly: Az L1 és az L2 regularizációhoz használt típusértékek. A regularizáció a modell betanítási adatoktól független aspektusait illetően korlátozásokat ad az algoritmusnak. A regularizációt gyakran használják a túlillesztés elkerülésére.

    • Az L1-regularizálás akkor hasznos, ha a cél egy olyan modell, amely a lehető ritka.

      Az L1 regularizálás a súly vektor L1 súlyának a tanuló által minimalizálni próbált veszteségkifejezésből való kivonásával történik. Az L1 norma jól közelíti az L0 normát, amely a nem nulla koordináták száma.

    • Az L2-regularizálás megakadályozza, hogy a súlyvektor minden egyes koordinátája túl nagyra nő. Az L2-regularizálás akkor hasznos, ha a cél egy kis összesített súlyozású modell.

    Ebben a modulban L1 és L2 regularizációk kombinációját alkalmazhatja. Az L1 és az L2 regularizáció kombinálásával büntetést szabhat ki a paraméterértékek nagyságrendjére. A tanuló megpróbálja minimalizálni a büntetést, a veszteség minimalizálásával.

    Az L1 és az L2 regularizációval kapcsolatos további megbeszélést az L1 és L2 regularizáció a Machine Learning.

  6. Memóriaméret az L-BFGS-hez: Adja meg, hogy mennyi memóriát foglal le a modell illesztésében és optimalizálásában.

    Az L-BFGS egy adott optimalizálási módszer, amely a Broyden–The Goldfarb–Shanno (BFGS) algoritmuson alapul. A metódus korlátozott mennyiségű memóriát (L) használ a következő lépés irányának kiszámításához.

    A paraméter módosításával befolyásolhatja a következő lépés számítása során tárolt korábbi pozíciók és színátmenetek számát.

  7. Csatlakozás betanítás adatkészletét és a betanítatlan modellt az egyik betanító modulhoz:

    Figyelmeztetés

    • Ha paramétertartományt ad át a Modell betanítása számára, az csak az első értéket használja a paramétertartományok listájában.

    • Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása modulnak, és az egyes paraméterekhez egy beállítástartományt vár, az figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanuló számára.

    • Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az Ön által megadott egyetlen értéket használja a teljes tartományban, még akkor is, ha más paraméterek változnak egy értéktartományban.

  8. Futtassa a kísérletet a modell betanításhoz.

Példák

Példák a Poisson-regresszió gépi tanulásban való használatára: Azure AI Gallery.

  • 6. minta: Betanítás, tesztelés, regresszió értékelése: Automatikus import adatkészlet: Ez a kísérlet két algoritmus eredményeit hasonlítja össze: a Poisson regressziót és a döntési erdő regresszióját.

  • Megelőző karbantartás: Kiterjesztett útmutató, amely a Poisson Regression segítségével értékeli a döntési erdőmodell által előrejel jelzett hibák súlyosságát.

Technikai megjegyzések

A Poisson-regresszió az adatok számának modellezéséhez használatos, feltéve, hogy a címke rendelkezik Poisson-eloszlástal. Használhatja például arra, hogy egy adott napon előrejelezni tudja az ügyfélszolgálati központhoz való hívások számát.

Ehhez az algoritmushoz feltételezzük, hogy egy ismeretlen függvény ( Y) egy Poisson-eloszlást tartalmaz. A Poisson-eloszlás meghatározása a következő:

Az x = (x0, ..., xd-1) példány alapján minden k=0,1, ...esetén a modul kiszámítja annak a valószínűségét, hogy a példány értéke k.

Given the set of training examples, the algorithm tries to find the optimal values for θ0, …,θD-1 by trying to maximize the log likelihood of the parameters. The likelihood of the parameters θ0, …,θD-1 is the probability that the training data was sampled from a distribution with these parameters.

A napló valószínűsége logp(y = perc) ként is megtekinthető

Az előrejelzési függvény a paraméteres Poisson-eloszlás várt értékét, pontosabban: fw,b(x) = E[Y|x] = ewTx+b.

További információt a Wikipediában a Poisson-regresszió bejegyzésében láthat.

Modulparaméterek

Name Tartomány Típus Alapértelmezett Description
Optimalizálási tűréshatár >=double. Epsilon Float 0.0000001 Adjon meg egy tűrésértéket az optimalizálási konvergenciához. Minél alacsonyabb az érték, annál lassabb és pontosabb az illesztés.
L1 regularizációs súly >=0,0 Float 1.0 Adja meg az L1 regularizáció súlyát. A modell túlilledését elkerülendő használjon nullától nem megfelelő értéket.
L2 regularizációs súly >=0,0 Float 1.0 Adja meg az L2 regularizáció súlyát. A modell túlilledését elkerülendő használjon nullától nem megfelelő értéket.
Az L-BFGS memóriamérete >=1 Egész szám 20 Adja meg az L-BFGS-optimalizáló által használt memóriát (MB-ban). Kevesebb memóriával a betanítás gyorsabb, de kevésbé pontos.
Véletlenszerű szám kezdőszáma bármelyik Egész szám Írjon be egy értéket a modell által használt véletlenszám-generátor kezdőértékének megszabad tételhez. Hagyja üresen az alapértelmezett értéket.
Ismeretlen kategorikus szintek engedélyezése bármelyik Logikai true Jelezze, hogy minden kategorikus oszlophoz létre kell-e hoznunk egy további szintet. A tesztadatkészletnek a betanítás adatkészletben nem elérhető szintjei erre a további szintre vannak leképezve.

Kimenetek

Név Típus Description
Nem korlátozott modell ILearner interfész Nem korlátozott regressziós modell

Lásd még

Regresszió
A–Z modullista