Poisson-regresszió
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Létrehoz egy regressziós modellt, amely feltételezi, hogy az adatok eloszlása Poisson-eloszlást tartalmaz
Kategória: Machine Learning / Modell inicializálása /Regresszió
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használható a Poisson Regression modul a Machine Learning Studióban (klasszikus) Egy Poisson-regressziós modell létrehozásához.
A Poisson-regresszió olyan regressziós modellekben való használatra szolgál, amelyek numerikus értékek , általában számok előrejelzésére szolgálnak. Ezért ezt a modult csak akkor érdemes használnia a regressziós modell létrehozásához, ha a megjósolni próbált értékek a következő feltételekhez illeszkednek:
A válaszváltozó rendelkezik Egy Poisson-eloszlásval.
A darabszámok nem lehetnek negatívak. A metódus nem fog működni, ha negatív címkékkel próbálja használni.
A Poisson-eloszlás különálló eloszlás; ezért nem értelmezhető ezt a metódust nem egész számokkal használni.
Tipp
Ha a cél nem szám, akkor a Poisson-regresszió valószínűleg nem megfelelő módszer. Próbálja ki az egyik másik modult ebben a kategóriában. Ha segítségre van szüksége a regressziós módszer kiválasztása során, tekintse meg a Machine Learning algoritmus-adatlapot.
Miután beállította a regressziós metódust, be kell betaníta a modellt egy olyan adathalmaz használatával, amely példákat tartalmaz az előrejelezni kívánt értékre. A betanított modell ezután előrejelzésekhez használható.
További információk a Poisson-regresszióról
A Poisson-regresszió egy speciális regressziós elemzés, amely jellemzően a modellek darabszámának elemzésére használatos. A Poisson-regresszió például az alábbi helyzetekben lehet hasznos:
Repülőjáratokkal társított hideg utak számának modellezése
A vészhelyzeti szolgáltatáshívások számának becslése egy esemény során
Az előléptetést követő ügyfélkérések számának kivetítése
Válságtáblák létrehozása
Mivel a válaszváltozó rendelkezik Poisson-eloszlástal, a modell más feltételezéseket tesz az adatokról és annak valószínűségi eloszlásról, mint például a legkisebb négyzetes regresszióról. Ezért a Poisson-modelleket más regressziós modellektől eltérő módon kell értelmezni.
A Poisson-regresszió konfigurálása
Adja hozzá a Poisson Regression modult a kísérlethez a Studióban (klasszikus).
Ezt a modult a Regressziókategóriában Machine Learning – Inicializálás alatt találja.
Adjon hozzá egy adatkészletet, amely a megfelelő típusú betanításadatokat tartalmazza.
Javasoljuk, hogy a regresszió betanítása előtt az Adatok normalizálása használatával normalizálja a bemeneti adatkészletet.
A Poisson Regression modul Tulajdonságok panelén adja meg a modell betanítási módját az Oktatói mód létrehozása lehetőség beállításával.
Egyetlen paraméter: Ha tudja, hogyan szeretné konfigurálni a modellt, argumentumként adjon meg egy adott értékkészletet.
Paramétertartomány. Ha nem biztos a legjobb paraméterekben, a Modell hiperparaméterek hangolása modullal paraméteres siklikus adatokat kell használnia . Az oktatók több ön által megadott értékkel iterálnak az optimális konfiguráció megtalálása érdekében.
Optimalizálási tűréshatár: Adjon meg egy értéket, amely meghatározza a tűréshatárt az optimalizálás során. Minél alacsonyabb az érték, annál lassabb és pontosabb az illesztés.
L1 regularizációs súly és L2 regularizációs súly: Az L1 és az L2 regularizációhoz használt típusértékek. A regularizáció a modell betanítási adatoktól független aspektusait illetően korlátozásokat ad az algoritmusnak. A regularizációt gyakran használják a túlillesztés elkerülésére.
Az L1-regularizálás akkor hasznos, ha a cél egy olyan modell, amely a lehető ritka.
Az L1 regularizálás a súly vektor L1 súlyának a tanuló által minimalizálni próbált veszteségkifejezésből való kivonásával történik. Az L1 norma jól közelíti az L0 normát, amely a nem nulla koordináták száma.
Az L2-regularizálás megakadályozza, hogy a súlyvektor minden egyes koordinátája túl nagyra nő. Az L2-regularizálás akkor hasznos, ha a cél egy kis összesített súlyozású modell.
Ebben a modulban L1 és L2 regularizációk kombinációját alkalmazhatja. Az L1 és az L2 regularizáció kombinálásával büntetést szabhat ki a paraméterértékek nagyságrendjére. A tanuló megpróbálja minimalizálni a büntetést, a veszteség minimalizálásával.
Az L1 és az L2 regularizációval kapcsolatos további megbeszélést az L1 és L2 regularizáció a Machine Learning.
Memóriaméret az L-BFGS-hez: Adja meg, hogy mennyi memóriát foglal le a modell illesztésében és optimalizálásában.
Az L-BFGS egy adott optimalizálási módszer, amely a Broyden–The Goldfarb–Shanno (BFGS) algoritmuson alapul. A metódus korlátozott mennyiségű memóriát (L) használ a következő lépés irányának kiszámításához.
A paraméter módosításával befolyásolhatja a következő lépés számítása során tárolt korábbi pozíciók és színátmenetek számát.
Csatlakozás betanítás adatkészletét és a betanítatlan modellt az egyik betanító modulhoz:
Ha a Create trainer mode (Oktatói mód létrehozása)paramétert Single Parameter (Egyparaméteres) beállításra beállította, használja a Train Model (Modell betanítása) modult .
Ha az Oktató létrehozása módotParamétertartományra, használja a Modell hiperparaméterek hangolása modult .
Figyelmeztetés
Ha paramétertartományt ad át a Modell betanítása számára, az csak az első értéket használja a paramétertartományok listájában.
Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása modulnak, és az egyes paraméterekhez egy beállítástartományt vár, az figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanuló számára.
Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az Ön által megadott egyetlen értéket használja a teljes tartományban, még akkor is, ha más paraméterek változnak egy értéktartományban.
Futtassa a kísérletet a modell betanításhoz.
Példák
Példák a Poisson-regresszió gépi tanulásban való használatára: Azure AI Gallery.
6. minta: Betanítás, tesztelés, regresszió értékelése: Automatikus import adatkészlet: Ez a kísérlet két algoritmus eredményeit hasonlítja össze: a Poisson regressziót és a döntési erdő regresszióját.
Megelőző karbantartás: Kiterjesztett útmutató, amely a Poisson Regression segítségével értékeli a döntési erdőmodell által előrejel jelzett hibák súlyosságát.
Technikai megjegyzések
A Poisson-regresszió az adatok számának modellezéséhez használatos, feltéve, hogy a címke rendelkezik Poisson-eloszlástal. Használhatja például arra, hogy egy adott napon előrejelezni tudja az ügyfélszolgálati központhoz való hívások számát.
Ehhez az algoritmushoz feltételezzük, hogy egy ismeretlen függvény ( Y) egy Poisson-eloszlást tartalmaz. A Poisson-eloszlás meghatározása a következő:
Az x = (x0, ..., xd-1) példány alapján minden k=0,1, ...esetén a modul kiszámítja annak a valószínűségét, hogy a példány értéke k.
Given the set of training examples, the algorithm tries to find the optimal values for θ0, …,θD-1 by trying to maximize the log likelihood of the parameters. The likelihood of the parameters θ0, …,θD-1 is the probability that the training data was sampled from a distribution with these parameters.
A napló valószínűsége logp(y = perc) ként is megtekinthető
Az előrejelzési függvény a paraméteres Poisson-eloszlás várt értékét, pontosabban: fw,b(x) = E[Y|x] = ewTx+b.
További információt a Wikipediában a Poisson-regresszió bejegyzésében láthat.
Modulparaméterek
Name | Tartomány | Típus | Alapértelmezett | Description |
---|---|---|---|---|
Optimalizálási tűréshatár | >=double. Epsilon | Float | 0.0000001 | Adjon meg egy tűrésértéket az optimalizálási konvergenciához. Minél alacsonyabb az érték, annál lassabb és pontosabb az illesztés. |
L1 regularizációs súly | >=0,0 | Float | 1.0 | Adja meg az L1 regularizáció súlyát. A modell túlilledését elkerülendő használjon nullától nem megfelelő értéket. |
L2 regularizációs súly | >=0,0 | Float | 1.0 | Adja meg az L2 regularizáció súlyát. A modell túlilledését elkerülendő használjon nullától nem megfelelő értéket. |
Az L-BFGS memóriamérete | >=1 | Egész szám | 20 | Adja meg az L-BFGS-optimalizáló által használt memóriát (MB-ban). Kevesebb memóriával a betanítás gyorsabb, de kevésbé pontos. |
Véletlenszerű szám kezdőszáma | bármelyik | Egész szám | Írjon be egy értéket a modell által használt véletlenszám-generátor kezdőértékének megszabad tételhez. Hagyja üresen az alapértelmezett értéket. | |
Ismeretlen kategorikus szintek engedélyezése | bármelyik | Logikai | true | Jelezze, hogy minden kategorikus oszlophoz létre kell-e hoznunk egy további szintet. A tesztadatkészletnek a betanítás adatkészletben nem elérhető szintjei erre a további szintre vannak leképezve. |
Kimenetek
Név | Típus | Description |
---|---|---|
Nem korlátozott modell | ILearner interfész | Nem korlátozott regressziós modell |