Sdílet prostřednictvím


Poissonova regrese

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Vytvoří regresní model, který předpokládá, že data mají rozdělení Poissonova.

kategorie: Machine Learning/inicializovat Model/regrese

Poznámka

platí pro: jenom Machine Learning Studio (classic)

podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.

Přehled modulu

tento článek popisuje, jak použít modul poissonova regrese v aplikaci Machine Learning Studio (classic) k vytvoření poissonova regresního modelu.

Poissonova regrese je určena pro použití v regresních modelech, které se používají k předpovědi číselných hodnot, obvykle počítá. Proto byste měli použít tento modul k vytvoření regresního modelu pouze v případě, že hodnoty, které se pokoušíte odhadnout, odpovídají následujícím podmínkám:

  • Proměnná odpovědi má Poissonova rozdělení.

  • Počet nemůže být záporný. Pokud se pokusíte použít s negativními popisky, metoda se nezdařila.

  • Poissonova rozdělení je diskrétní distribuce; proto nemá smysl použít tuto metodu s neúplnými čísly.

Tip

Pokud Váš cíl není počet, je pravděpodobné, že funkce POISSON regrese není vhodnou metodou. Vyzkoušejte jeden z dalších modulů v této kategorii. nápovědu k vyzvednutí regresní metody najdete v tahákm listu s algoritmem pro Machine Learning.

Po nastavení metody regrese je nutné proškolit model pomocí datové sady obsahující příklady hodnoty, kterou chcete předpovědět. K vytvoření předpovědi se pak dá použít trained model.

Další informace o Poissonova regresi

Poissonova regrese je speciální typ regresní analýzy, který se obvykle používá pro počty modelů. Například funkce POISSON regrese by byla užitečná v těchto scénářích:

  • Modelování počtu studených přidružených k letů v letadle

  • Odhad počtu volání záchranné služby během události

  • Projektování počtu dotazů zákazníků následně po povýšení

  • Vytváření pohotovostních tabulek

Vzhledem k tomu, že proměnná Response má Poissonova rozdělení, model vytváří různé předpoklady pro data a rozdělení pravděpodobnosti, než je například regrese s minimálními čtverci. Poissonova modely by proto měly být interpretovány jinak než u ostatních regresních modelů.

Jak nakonfigurovat funkce POISSON regrese

  1. Přidejte modul Poissonova regrese do experimentu v studiu (Classic).

    tento modul můžete najít v části Machine Learning-Initializev kategorii regrese .

  2. Přidejte datovou sadu, která obsahuje školicí data správného typu.

    Doporučujeme použít normalizovaná data k normalizaci vstupní datové sady před jejím použitím ke školení regresor.

  3. V podokně vlastnosti v modulu Poissonova regrese určete, jak chcete, aby byl model vyškolený, nastavením možnosti vytvořit Trainer režim .

    • Jediný parametr: Pokud víte, jak chcete model konfigurovat, poskytněte konkrétní sadu hodnot jako argumenty.

    • Rozsah parametrů Pokud si nejste jistí, co nejlépe parametry, udělejte pomocí modulu ladit model modulů s parametry hodnotu sweep. Trainer projde více hodnot, které zadáte, abyste našli optimální konfiguraci.

  4. Tolerance optimalizace: zadejte hodnotu, která definuje interval tolerance během optimalizace. Čím nižší hodnota, tím pomalejší a přesnější přizpůsobení.

  5. Váha pravidelného využití L1 a váha pro pravidelnosti L2: hodnoty typu, které se mají použít pro práci s L1 a L2. Při provádění se přidávají omezení algoritmu týkající se aspektů modelu, které jsou nezávisle na školicích datech. Často se používá k tomu, aby se zabránilo přebudování.

    • Pravidelnáace L1 je užitečná v případě, že cílem je mít model, který je co možná zhuštěný.

      Pravidelná práce s L1 je prováděna odečtením váhy pro daný vektor váhy od výrazu ztráty, který se snaží minimalizovat. Norma L1 je dobrým odhadem pro normu L0, což je počet nenulových souřadnic.

    • Pravidelná navýšení L2 brání v tom, aby se jedna souřadnice ve velikosti vektoru rozrůsta příliš daleko. Pravidelné vyvážení L2 je užitečné, pokud cílem je model s malým celkovým hmotností.

    V tomto modulu můžete použít kombinaci L1 a L2 regularizations. Kombinováním L1 a L2 můžete na základě velikosti hodnot parametrů ukládat pokutu. Tento nástroj se snaží minimalizovat pokutu při kompromisech s minimalizací ztráty.

    dobré diskuzi o l1 a l2 najdete v tématu l1 a l2 pro Machine Learning.

  6. Velikost paměti pro L-BFGS: zadejte velikost paměti, která se má vyhradit pro přizpůsobení modelu a optimalizaci.

    L-BFGS je specifická metoda pro optimalizaci založená na algoritmu Broyden – Fletcher – Goldfarb-Shanno (BFGS). Metoda používá k výpočtu směru dalšího kroku omezené množství paměti (L).

    Změnou tohoto parametru můžete ovlivnit počet minulých pozic a přechodů, které jsou uloženy pro výpočet dalšího kroku.

  7. Připojení datovou sadu školení a nevýukový model na jeden ze školicích modulů:

    • Pokud nastavíte režim vytvořit Trainer na jeden parametr, použijte modul vlakového modelu .

    • Pokud nastavíte režim vytvořit Trainer na rozsah parametrů, použijte modul ladit model s parametry .

    Upozornění

    • Pokud předáte rozsah parametru pro vlakový model, použije se pouze první hodnota v seznamu rozsah parametrů.

    • Pokud předáte jednu sadu hodnot parametrů do modulu předparametrů modelu ladění , když očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro učit se.

    • Pokud vyberete možnost rozsahu parametrů a zadáte jednu hodnotu pro libovolný parametr, tato jediná hodnota, kterou jste zadali, se použije v celém oblouku, a to i v případě, že se jiné parametry mění v rozsahu hodnot.

  8. Spusťte experiment pro výuku modelu.

Příklady

Příklady toho, jak se ve službě Machine Learning používá funkce POISSON regrese, najdete v Azure AI Gallery.

Technické poznámky

Funkce POISSON regrese se používá k modelování dat čítače za předpokladu, že má popisek Poissonova rozdělení. Můžete ho například použít k předběžnému odhadu počtu volání centra zákaznické podpory v konkrétní den.

Pro tento algoritmus se předpokládá, že neznámá funkce, označená Y, má Poissonova rozdělení. Poissonova rozdělení je definováno následujícím způsobem:

Vzhledem k instanci x = (x0,..., xD-1) pro každý k = 0, 1,... modul vypočítá pravděpodobnost, že hodnota instance je k.

V případě sady příkladů cvičení se algoritmus pokusí najít optimální hodnoty pro θ0,..., θD-1 a snaží se maximalizovat pravděpodobnost protokolu pro parametry. Pravděpodobnost parametrů θ0,..., θD-1 je pravděpodobnost, že data školení byla vzorkovat z distribuce s těmito parametry.

Pravděpodobnost protokolu se dá zobrazit jako protokolp(y = Yi).

Funkce předpovědi vyprodukuje očekávanou hodnotu pro parametrizované rozdělení Poissonova, konkrétně: fw, b (x) = E [Y | x] = EwTx + b.

Další informace najdete v záznamu o Poissonova regresi v Wikipedii.

Parametry modulu

Name Rozsah Typ Výchozí Description
Tolerance optimalizace >= Double. Kurzív Float 0,0000001 Zadejte hodnotu tolerance pro konvergenci optimalizace. Čím nižší hodnota, tím pomalejší a přesnější přizpůsobení.
Pravidelná váha L1 >= 0,0 Float 1.0 Zadejte váhu pravidelného navýšení L1. K zamezení přebudování modelu použijte nenulovou hodnotu.
Váha pro pravidelnost L2 >= 0,0 Float 1.0 Zadejte váhu pravidelného L2. K zamezení přebudování modelu použijte nenulovou hodnotu.
Velikost paměti pro L-BFGS >= 1 Integer 20 Určete, kolik paměti (v MB) se má použít pro Optimalizátor L-BFGS. S menším množstvím paměti je školení rychlejší, ale méně přesného školení.
Počáteční počáteční číslo Libovolný Integer Zadejte hodnotu pro počáteční generátor náhodných čísel používaný modelem. Ve výchozím nastavení ponechte prázdné.
Povolení neznámých úrovní kategorií Libovolný Logická hodnota true Určuje, zda má být pro každý sloupec kategorií vytvořená další úroveň. Všechny úrovně v testovací sadě, které nejsou k dispozici v datové sadě školení, jsou namapovány na tuto další úroveň.

Výstupy

Název Typ Description
Nevlakový model Rozhraní ILearner Nevýukový model regrese

Viz také

Regrese
Seznam modulů a-Z