Komponenta logistické regrese s více třídami

Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.

Tato komponenta slouží k vytvoření logistického regresního modelu, který lze použít k predikci více hodnot.

Klasifikace s využitím logistické regrese je metoda učení pod dohledem, a proto vyžaduje datovou sadu s popiskem. Model vytrénujete tak, že model a datovou sadu s popiskem zadáte jako vstup do komponenty, jako je trénování modelu. Natrénovaný model se pak dá použít k predikci hodnot pro nové příklady vstupu.

Azure Machine Learning také poskytuje komponentu logistické regrese se dvěma třídami , která je vhodná pro klasifikaci binárních nebo dichotomních proměnných.

Informace o logistické regresi s více třídami

Logistická regrese je dobře známá metoda ve statistikách, která se používá k predikci pravděpodobnosti výsledku a je oblíbená pro úlohy klasifikace. Algoritmus předpovídá pravděpodobnost výskytu události přizpůsobením dat logistické funkci.

V logistické regresi s více třídami lze klasifikátor použít k predikci více výsledků.

Konfigurace logistické regrese s více třídami

  1. Přidejte do kanálu komponentu Logistická regrese multiclass .

  2. Nastavením možnosti Vytvořit režim školitele určete, jak má být model vytrénován.

    • Jeden parametr: Tuto možnost použijte, pokud víte, jak chcete model nakonfigurovat, a jako argumenty zadáte konkrétní sadu hodnot.

    • Rozsah parametrů: Tuto možnost vyberte, pokud si nejste jistí nejlepšími parametry a chcete spustit úklid parametrů. Vyberte rozsah hodnot, které chcete iterovat, a hyperparametry tune modelu iteruje všechny možné kombinace nastavení, které jste zadali, a určí hyperparametry, které generují optimální výsledky.

  3. Tolerance optimalizace, zadejte prahovou hodnotu pro konvergenci optimalizátoru. Pokud je zlepšení mezi iteracemi menší než prahová hodnota, algoritmus se zastaví a vrátí aktuální model.

  4. Hmotnost regularizace L1, hmotnost regularizace L2: Zadejte hodnotu, která se má použít pro parametry regularizace L1 a L2. Pro obojí se doporučuje nenulová hodnota.

    Regularizace je metoda, jak zabránit přeurčení pomocí penalizace modelů s extrémními hodnotami koeficientu. Regularizace funguje tak, že se k chybě hypotézy přidá penalizace, která je spojená s hodnotami koeficientů. Přesný model s extrémními hodnotami koeficientů by byl penalizován více, ale méně přesný model s konzervativnějšími hodnotami by byl penalizován méně.

    Regularizace L1 a L2 mají různé účinky a použití. L1 lze použít u řídkých modelů, což je užitečné při práci s vysokodimenzionálními daty. Naproti tomu regularizace L2 je vhodnější pro data, která nejsou zhuštěná. Tento algoritmus podporuje lineární kombinaci hodnot regularizace L1 a L2: to znamená, že pokud x = L1 a y = L2, ax + by = c definuje lineární rozsah termínů regularizace.

    Pro logistické regresní modely byly navrženy různé lineární kombinace termínů L1 a L2, jako je například elastická regularizace sítě.

  5. Náhodné počáteční číslo: Zadejte celočíselnou hodnotu, která se použije jako počáteční hodnota algoritmu, pokud chcete, aby se výsledky opakovaly během běhů. V opačném případě se jako počáteční hodnota použije hodnota systémových hodin, která může při spuštěních stejného kanálu způsobit mírně odlišné výsledky.

  6. Připojte datovou sadu s popiskem a vytrénujte model:

    • Pokud nastavíte Vytvořit režim školitele na jeden parametr, propojte označenou datovou sadu a komponentu Trénování modelu .

    • Pokud nastavíte Vytvořit režim školitele na Rozsah parametrů, připojte označenou datovou sadu a vytrénujte model pomocí ladění hyperparametrů modelu.

    Poznámka

    Pokud do trénování modelu předáte rozsah parametrů, použije se pouze výchozí hodnota v seznamu s jedním parametrem.

    Pokud předáte jednu sadu hodnot parametrů do komponenty Tune Model Hyperparameters , pokud očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro learner.

    Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se tato jedna hodnota, kterou jste zadali, v průběhu úklidu, i když se jiné parametry v rozsahu hodnot mění.

  7. Odešlete kanál.

Další kroky

Projděte si sadu komponent dostupných pro Azure Machine Learning.