Poissonova regrese

Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.

Tuto komponentu použijte k vytvoření Poissonova regresního modelu v kanálu. Poissonova regrese je určená k předpovídání číselných hodnot, obvykle počtů. Proto byste tuto komponentu měli použít k vytvoření regresního modelu pouze v případě, že hodnoty, které se pokoušíte předpovědět, odpovídají následujícím podmínkám:

  • Proměnná odpovědi má Poissonovo rozdělení.

  • Počty nesmí být záporné. Metoda selže přímo, pokud se ji pokusíte použít se zápornými popisky.

  • Poissonovo rozdělení je diskrétní rozdělení; proto nemá smysl používat tuto metodu s necelky.

Tip

Pokud vaším cílem není počet, poissonova regrese pravděpodobně není vhodná metoda. V návrháři zkuste jiné regresní komponenty.

Po nastavení regresní metody musíte model vytrénovat pomocí datové sady obsahující příklady hodnoty, kterou chcete předpovědět. Trénovaný model se pak dá použít k předpovědím.

Poissonova regrese – podrobnější informace

Poissonova regrese je speciální typ regresní analýzy, která se obvykle používá k modelování počtů. Například Poissonova regrese by byla užitečná v těchto scénářích:

  • Modelování počtu nachlazení spojených s lety v letadle

  • Odhad počtu volání služeb tísňového volání během události

  • Promítání počtu dotazů zákazníků po propagační akci

  • Vytváření tabulek nepředvídaných událostí

Vzhledem k tomu, že proměnná odpovědi má Poissonovo rozdělení, model provádí jiné předpoklady o datech a jejich rozdělení pravděpodobnosti než například regrese nejmenších čtverců. Poissonův model by se proto měl interpretovat odlišně od ostatních regresních modelů.

Konfigurace Poissonova regrese

  1. Přidejte komponentu PoissonOva regrese do kanálu v návrháři. Tuto komponentu najdete v kategorii Regrese v části Algoritmy strojového učení.

  2. Přidejte datovou sadu, která obsahuje trénovací data správného typu.

    Doporučujeme použít funkci Normalizovat data k normalizaci vstupní datové sady, než ji použijete k trénování regresoru.

  3. V pravém podokně komponenty PoissonOva regrese určete, jak se má model trénovat, nastavením možnosti Vytvořit režim školitele .

    • Jeden parametr: Pokud víte, jak chcete model nakonfigurovat, zadejte jako argumenty konkrétní sadu hodnot.

    • Rozsah parametrů: Pokud si nejste jisti nejlepšími parametry, proveďte úklid parametrů pomocí komponenty Tune Model Hyperparametry . Školitel iteruje více zadaných hodnot, aby zjistil optimální konfiguraci.

  4. Tolerance optimalizace: Zadejte hodnotu, která definuje interval tolerance během optimalizace. Čím nižší hodnota, tím pomalejší a přesnější je přizpůsobení.

  5. Hmotnost regularizace L1 a hmotnost regularizace L2: Hodnoty typu, které se mají použít pro regularizaci L1 a L2. Regularizace přidává do algoritmu omezení týkající se aspektů modelu, které jsou nezávislé na trénovacích datech. Regularizace se běžně používá k tomu, aby se zabránilo přeurčení.

    • Regularizace L1 je užitečná, pokud je cílem mít model, který je co nejvíce zhuštěný.

      Regularizace L1 se provádí odečtením hmotnosti L1 vektoru hmotnosti od výrazu ztráty, který se učící se snaží minimalizovat. Norma L1 představuje dobrou aproximaci k normě L0, což je počet nenulových souřadnic.

    • Regularizace L2 zabraňuje tomu, aby jakákoli jednotlivá souřadnice ve vektoru hmotnosti příliš narostla do velikosti. Regularizace L2 je užitečná, pokud je cílem mít model s nízkou celkovou hmotností.

    V této komponentě můžete použít kombinaci regularizace L1 a L2. Kombinací regularizace L1 a L2 můžete uložit penalizaci na velikost hodnot parametrů. Učící se snaží minimalizovat trest v rámci kompromisu s minimalizací ztráty.

    Dobrou diskuzi o regularizaci L1 a L2 najdete v tématech O regularizaci L1 a L2 pro strojové učení.

  6. Velikost paměti pro L-BFGS: Zadejte velikost paměti, která se má rezervovat pro přizpůsobení a optimalizaci modelu.

    L-BFGS je specifická metoda optimalizace založená na algoritmu BFGS (Broyden-Fletcher-Goldfarb-Shanno). Metoda používá omezené množství paměti (L) k výpočtu směru dalšího kroku.

    Změnou tohoto parametru můžete ovlivnit počet minulých pozic a přechodů, které jsou uložené pro výpočet dalšího kroku.

  7. Připojte trénovací datovou sadu a netrénovaný model k jedné z trénovacích komponent:

    • Pokud nastavíte Vytvořit režim školitele na Jeden parametr, použijte komponentu Trénování modelu .

    • Pokud nastavíte Vytvořit režim školitele na Rozsah parametrů, použijte komponentu Tune Model Hyperparametry .

    Upozornění

    • Pokud do Trénování modelu předáte rozsah parametrů, použije se pouze první hodnota v seznamu rozsahů parametrů.

    • Pokud předáte jednu sadu hodnot parametrů komponentě Tune Model Hyperparameters , když očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro učícího se.

    • Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se tato zadaná hodnota v průběhu úklidu, a to i v případě, že se jiné parametry v rámci rozsahu hodnot mění.

  8. Odešlete kanál.

Výsledky

Po dokončení trénování:

  • Pokud chcete uložit snímek natrénovaného modelu, vyberte komponentu trénování a pak na pravém panelu přepněte na kartu Výstupy a protokoly . Klikněte na ikonu Zaregistrovat datovou sadu. Uložený model najdete jako komponentu ve stromu komponent.

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.