Poisson-regresszió

Cikk
05/06/2019

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
További információ a Azure Machine Learning.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Létrehoz egy regressziós modellt, amely feltételezi, hogy az adatok eloszlása Poisson-eloszlást tartalmaz

Kategória: Machine Learning / Modell inicializálása /Regresszió

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a Poisson Regression modul a Machine Learning Studióban (klasszikus) Egy Poisson-regressziós modell létrehozásához.

A Poisson-regresszió olyan regressziós modellekben való használatra szolgál, amelyek numerikus értékek , általában számok előrejelzésére szolgálnak. Ezért ezt a modult csak akkor érdemes használnia a regressziós modell létrehozásához, ha a megjósolni próbált értékek a következő feltételekhez illeszkednek:

A válaszváltozó rendelkezik Egy Poisson-eloszlásval.
A darabszámok nem lehetnek negatívak. A metódus nem fog működni, ha negatív címkékkel próbálja használni.
A Poisson-eloszlás különálló eloszlás; ezért nem értelmezhető ezt a metódust nem egész számokkal használni.

Tipp

Ha a cél nem szám, akkor a Poisson-regresszió valószínűleg nem megfelelő módszer. Próbálja ki az egyik másik modult ebben a kategóriában. Ha segítségre van szüksége a regressziós módszer kiválasztása során, tekintse meg a Machine Learning algoritmus-adatlapot.

Miután beállította a regressziós metódust, be kell betaníta a modellt egy olyan adathalmaz használatával, amely példákat tartalmaz az előrejelezni kívánt értékre. A betanított modell ezután előrejelzésekhez használható.

További információk a Poisson-regresszióról

A Poisson-regresszió egy speciális regressziós elemzés, amely jellemzően a modellek darabszámának elemzésére használatos. A Poisson-regresszió például az alábbi helyzetekben lehet hasznos:

Repülőjáratokkal társított hideg utak számának modellezése
A vészhelyzeti szolgáltatáshívások számának becslése egy esemény során
Az előléptetést követő ügyfélkérések számának kivetítése
Válságtáblák létrehozása

Mivel a válaszváltozó rendelkezik Poisson-eloszlástal, a modell más feltételezéseket tesz az adatokról és annak valószínűségi eloszlásról, mint például a legkisebb négyzetes regresszióról. Ezért a Poisson-modelleket más regressziós modellektől eltérő módon kell értelmezni.

A Poisson-regresszió konfigurálása

Adja hozzá a Poisson Regression modult a kísérlethez a Studióban (klasszikus).

Ezt a modult a Regressziókategóriában Machine Learning – Inicializálás alatt találja.
Adjon hozzá egy adatkészletet, amely a megfelelő típusú betanításadatokat tartalmazza.

Javasoljuk, hogy a regresszió betanítása előtt az Adatok normalizálása használatával normalizálja a bemeneti adatkészletet.
A Poisson Regression modul Tulajdonságok panelén adja meg a modell betanítási módját az Oktatói mód létrehozása lehetőség beállításával.
- Egyetlen paraméter: Ha tudja, hogyan szeretné konfigurálni a modellt, argumentumként adjon meg egy adott értékkészletet.
- Paramétertartomány. Ha nem biztos a legjobb paraméterekben, a Modell hiperparaméterek hangolása modullal paraméteres siklikus adatokat kell használnia . Az oktatók több ön által megadott értékkel iterálnak az optimális konfiguráció megtalálása érdekében.
Optimalizálási tűréshatár: Adjon meg egy értéket, amely meghatározza a tűréshatárt az optimalizálás során. Minél alacsonyabb az érték, annál lassabb és pontosabb az illesztés.
L1 regularizációs súly és L2 regularizációs súly: Az L1 és az L2 regularizációhoz használt típusértékek. A regularizáció a modell betanítási adatoktól független aspektusait illetően korlátozásokat ad az algoritmusnak. A regularizációt gyakran használják a túlillesztés elkerülésére.
- Az L1-regularizálás akkor hasznos, ha a cél egy olyan modell, amely a lehető ritka.
  
  Az L1 regularizálás a súly vektor L1 súlyának a tanuló által minimalizálni próbált veszteségkifejezésből való kivonásával történik. Az L1 norma jól közelíti az L0 normát, amely a nem nulla koordináták száma.
- Az L2-regularizálás megakadályozza, hogy a súlyvektor minden egyes koordinátája túl nagyra nő. Az L2-regularizálás akkor hasznos, ha a cél egy kis összesített súlyozású modell.
Ebben a modulban L1 és L2 regularizációk kombinációját alkalmazhatja. Az L1 és az L2 regularizáció kombinálásával büntetést szabhat ki a paraméterértékek nagyságrendjére. A tanuló megpróbálja minimalizálni a büntetést, a veszteség minimalizálásával.

Az L1 és az L2 regularizációval kapcsolatos további megbeszélést az L1 és L2 regularizáció a Machine Learning.
Memóriaméret az L-BFGS-hez: Adja meg, hogy mennyi memóriát foglal le a modell illesztésében és optimalizálásában.

Az L-BFGS egy adott optimalizálási módszer, amely a Broyden–The Goldfarb–Shanno (BFGS) algoritmuson alapul. A metódus korlátozott mennyiségű memóriát (L) használ a következő lépés irányának kiszámításához.

A paraméter módosításával befolyásolhatja a következő lépés számítása során tárolt korábbi pozíciók és színátmenetek számát.
Csatlakozás betanítás adatkészletét és a betanítatlan modellt az egyik betanító modulhoz:
- Ha a Create trainer mode (Oktatói mód létrehozása)paramétert Single Parameter (Egyparaméteres) beállításra beállította, használja a Train Model (Modell betanítása) modult .
- Ha az Oktató létrehozása módotParamétertartományra, használja a Modell hiperparaméterek hangolása modult .
Figyelmeztetés
- Ha paramétertartományt ad át a Modell betanítása számára, az csak az első értéket használja a paramétertartományok listájában.
- Ha egyetlen paraméterérték-készletet ad át a Modell hiperparaméterek hangolása modulnak, és az egyes paraméterekhez egy beállítástartományt vár, az figyelmen kívül hagyja az értékeket, és az alapértelmezett értékeket használja a tanuló számára.
- Ha a Paramétertartomány lehetőséget választja, és egyetlen értéket ad meg bármely paraméterhez, akkor a rendszer az Ön által megadott egyetlen értéket használja a teljes tartományban, még akkor is, ha más paraméterek változnak egy értéktartományban.
Futtassa a kísérletet a modell betanításhoz.

Példák

Példák a Poisson-regresszió gépi tanulásban való használatára: Azure AI Gallery.

6. minta: Betanítás, tesztelés, regresszió értékelése: Automatikus import adatkészlet: Ez a kísérlet két algoritmus eredményeit hasonlítja össze: a Poisson regressziót és a döntési erdő regresszióját.
Megelőző karbantartás: Kiterjesztett útmutató, amely a Poisson Regression segítségével értékeli a döntési erdőmodell által előrejel jelzett hibák súlyosságát.

Technikai megjegyzések

A Poisson-regresszió az adatok számának modellezéséhez használatos, feltéve, hogy a címke rendelkezik Poisson-eloszlástal. Használhatja például arra, hogy egy adott napon előrejelezni tudja az ügyfélszolgálati központhoz való hívások számát.

Ehhez az algoritmushoz feltételezzük, hogy egy ismeretlen függvény ( Y) egy Poisson-eloszlást tartalmaz. A Poisson-eloszlás meghatározása a következő:

Az x = (x0, ..., xd-1) példány alapján minden k=0,1, ...esetén a modul kiszámítja annak a valószínűségét, hogy a példány értéke k.

Given the set of training examples, the algorithm tries to find the optimal values for θ0, …,θD-1 by trying to maximize the log likelihood of the parameters. The likelihood of the parameters θ0, …,θD-1 is the probability that the training data was sampled from a distribution with these parameters.

A napló valószínűsége logp(y = perc) ként is megtekinthető

Az előrejelzési függvény a paraméteres Poisson-eloszlás várt értékét, pontosabban: fw,b(x) = E[Y|x] = ^ewTx^+b.

További információt a Wikipediában a Poisson-regresszió bejegyzésében láthat.

Modulparaméterek

Name	Tartomány	Típus	Alapértelmezett	Description
Optimalizálási tűréshatár	>=double. Epsilon	Float	0.0000001	Adjon meg egy tűrésértéket az optimalizálási konvergenciához. Minél alacsonyabb az érték, annál lassabb és pontosabb az illesztés.
L1 regularizációs súly	>=0,0	Float	1.0	Adja meg az L1 regularizáció súlyát. A modell túlilledését elkerülendő használjon nullától nem megfelelő értéket.
L2 regularizációs súly	>=0,0	Float	1.0	Adja meg az L2 regularizáció súlyát. A modell túlilledését elkerülendő használjon nullától nem megfelelő értéket.
Az L-BFGS memóriamérete	>=1	Egész szám	20	Adja meg az L-BFGS-optimalizáló által használt memóriát (MB-ban). Kevesebb memóriával a betanítás gyorsabb, de kevésbé pontos.
Véletlenszerű szám kezdőszáma	bármelyik	Egész szám		Írjon be egy értéket a modell által használt véletlenszám-generátor kezdőértékének megszabad tételhez. Hagyja üresen az alapértelmezett értéket.
Ismeretlen kategorikus szintek engedélyezése	bármelyik	Logikai	true	Jelezze, hogy minden kategorikus oszlophoz létre kell-e hoznunk egy további szintet. A tesztadatkészletnek a betanítás adatkészletben nem elérhető szintjei erre a további szintre vannak leképezve.

Kimenetek

Név	Típus	Description
Nem korlátozott modell	ILearner interfész	Nem korlátozott regressziós modell

Lásd még

Regresszió
A–Z modullista

Megosztás a következőn keresztül: