Logistická regrese s více třídami
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- Podívejte se na informace o přesunu projektů strojového učení z ML Studia (klasického) do Azure Machine Learning.
- Další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Vytvoří vícetřídový model klasifikace logistické regrese.
Kategorie: Machine Learning / Inicializovat model / klasifikaci
Poznámka
Platí pro: Machine Learning Studio (classic)
Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.
Přehled modulu
Tento článek popisuje, jak pomocí modulu Logistická regrese s více třídami v Machine Learning Studiu (klasickém) vytvořit logistický regresní model, který lze použít k předpovídání více hodnot.
Klasifikace pomocí logistické regrese je metoda učení pod dohledem, a proto vyžaduje datovou sadu označenou popiskem. Model vytrénujete tak, že poskytnete model a datovou sadu s popiskem jako vstup pro modul, jako je trénování modelu nebo ladění hyperparametrů modelu. Vytrénovaný model pak můžete použít k předpovídání hodnot pro nové vstupní příklady.
Machine Learning Studio (classic) také poskytuje modul logistické regrese se dvěma třídami, který je vhodný pro klasifikaci binárních nebo dichotomních proměnných.
Další informace o vícetřídové logistické regresi
Logistická regrese je dobře známá metoda ve statistikách, která se používá k predikci pravděpodobnosti výsledku a je obzvláště oblíbená pro klasifikační úkoly. Algoritmus předpovídá pravděpodobnost výskytu události tím, že data fituje do logistické funkce. Podrobnosti o této implementaci najdete v části Technické poznámky.
U vícetřídové logistické regrese lze klasifikátor použít k předpovídání více výsledků.
Jak nakonfigurovat logistickou regresi s více třídami
Přidejte do experimentu modul Logistická regrese s více třídami.
Nastavením možnosti Vytvořit režim školitele určete, jak chcete model vytrénovat.
Jeden parametr: Tuto možnost použijte, pokud víte, jak chcete model nakonfigurovat, a zadejte konkrétní sadu hodnot jako argumenty.
Rozsah parametrů: Tuto možnost použijte, pokud si nejste jistí nejlepšími parametry a chcete použít úklid parametrů.
Tolerance optimalizace– zadejte prahovou hodnotu pro konvergenci optimalizátoru. Pokud je zlepšení mezi iteracemi nižší než prahová hodnota, algoritmus se zastaví a vrátí aktuální model.
Váha regularizace L1, váha regularizace L2: Zadejte hodnotu, která se má použít pro parametry regularizace L1 a L2. Pro oba se doporučuje nenulová hodnota.
Regularizace je metoda, která brání přeučení penalizací modelů s extrémními hodnotami koeficientu. Regularizace funguje tak, že se k chybě hypotézy přidá penalizace, která je spojená s hodnotami koeficientů. Přesný model s extrémními hodnotami koeficientu by byl penalizován více, ale méně přesný model s více pravdivějšími hodnotami by byl penalizován méně.
Regularizace L1 a L2 má různé účinky a použití. L1 lze použít pro zhuštěné modely, což je užitečné při práci s vysoce dimenzionálními daty. Naproti tomu regularizace L2 je vhodnější pro data, která nejsou zhuštěná. Tento algoritmus podporuje lineární kombinaci hodnot regularizace L1 a L2: to znamená, že
x = L1
y = L2
pokud a ,ax + by = c
definuje lineární rozsah termínů regularizace.Pro modely logistické regrese byly navrženy různé lineární kombinace termínů L1 a L2, jako je elastická regularizace.
Velikost paměti pro L-BFGS: Zadejte velikost paměti, která se má použít pro optimalizaci L-BFGS . Tento parametr určuje počet minulých pozic a přechodů, které se uloží pro výpočet dalšího kroku.
L-BFGS je zkratka pro omezenou paměť Broyden-En-Goldfarb-Shanno a jedná se o optimalizační algoritmus, který je oblíbený pro odhad parametrů. Tento parametr optimalizace omezuje množství paměti, které se používá k výpočtu dalšího kroku a směru. Pokud zadáte méně paměti, trénování je rychlejší, ale méně přesné.
Předčítá se náhodné číslo: Zadejte celočíselnou hodnotu, která se použije jako přediména algoritmu, pokud chcete, aby se výsledky v průběhu spuštění opakoval. Jinak se hodnota systémových hodin použije jako přediména, což může při spuštění stejného experimentu způsobit trochu odlišné výsledky.
Povolit neznámé úrovně kategorií: Tuto možnost vyberte, pokud chcete v každém sloupci kategorií vytvořit další "neznámou" úroveň. Všechny hodnoty (úrovně) v testovací datové sadě, které nejsou v trénovací datové sadě, se mapují na tuto "neznámou" úroveň.
Připojení datovou sadu s popiskem a jeden z trénovaných modulů:
Pokud nastavíte Vytvořit režim školitele na Jeden parametr, použijte modul Trénování modelu.
Pokud nastavíte Vytvořit režim školitelena Rozsah parametrů, použijte modul Tune Model Hyperparameters (Vyladit model hyperparametrů ). Pomocí této možnosti můžete zadat více hodnot a školitel iteruje přes několik kombinací nastavení, aby určil kombinaci hodnot, které vytvářejí nejlepší model.
Poznámka
Pokud předáte rozsah parametrů do trénového modelu, použije se pouze první hodnota v seznamu rozsahů parametrů.
Pokud modulu Vyladění modelu hyperparametrů předáte jednu sadu hodnot parametrů, bude modul, který očekává rozsah nastavení pro každý parametr, ignorovat tyto hodnoty a použije výchozí hodnoty pro toho, kdo se učí.
Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se tato jedna hodnota, kterou jste zadali v průběhu úklidu, i když se jiné parametry v rozsahu hodnot změní.
Spusťte experiment.
Výsledky
Po dokončení trénování:
- Pokud chcete zobrazit souhrn parametrů modelu spolu s váhami vlastností naučenými při trénování, klikněte pravým tlačítkem na výstup modulu Trénování modelu nebo Vyladit hyperparametry modelu a vyberte Vizualizovat.
Příklady
Příklady použití tohoto algoritmu učení najdete v Azure AI Gallery:
Clustering Iris: Porovnává výsledky vícetřídové logistické regrese s clusteringem K-Means.
Detekce vniknutí do sítě: Pomocí binární logistické regrese určí, jestli případ představuje vniknutí.
Křížové ověřování binárních klasifikátorů: Demonstruje použití logistické regrese v typickém experimentálním pracovním postupu, včetně vyhodnocení modelu.
Technické poznámky
Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.
Související výzkum
Chcete se dozvědět více o regularizaci L1 a L2? Následující článek obsahuje diskuzi o tom, jak se regularizace L1 a L2 liší a jak ovlivňují fitování modelu, a ukázky kódu pro logistické regrese a modely neurálních sítí.
Další informace o implementaci tohoto algoritmu najdete tady:
- Scalable Training of L-1 Regularized Log-Linear Models , od Andrewa a Gao.
Podrobnosti o implementaci
Logistická regrese vyžaduje číselné proměnné. Proto když se pokusíte použít kategorické sloupce jako proměnnou, Machine Learning hodnoty interně převede na pole indikátorů.
Pro data a časy se používá číselná reprezentace. Další informace o hodnotách data a času najdete v tématu Struktura data a času .NET Framework. Pokud chcete zpracovávat data a časy odlišně, doporučujeme vytvořit odvozený sloupec.
Standardní logistická regrese je binomial a předpokládá dvě výstupní třídy. Vícetřídová nebo multinomická logistická regrese předpokládá tři nebo více výstupních tříd.
Binomial logistická regrese předpokládá logistické rozdělení dat, kde pravděpodobnost, že příklad patří do třídy 1, je vzorec:
p(x;β0,…, βD-1)
Kde:
x je D-dimenzionální vektor obsahující hodnoty všech funkcí instance.
p je logistická distribuční funkce.
β{0},..., β {D-1}
jsou neznámé parametry logistické distribuce.
Algoritmus se snaží najít optimální hodnoty pro maximalizací β{0},..., β {D-1}
pravděpodobnosti protokolu parametrů naměřené vstupy. Maximalizace se provádí pomocí oblíbené metody pro odhad parametrů, která se nazývá BFGS s omezenou pamětí.
Parametry modulu
Name | Rozsah | Typ | Výchozí | Description |
---|---|---|---|---|
Tolerance optimalizace | >= Double. Kurzív | Float | 0,0000001 | Zadejte hodnotu tolerance pro modul BFGS pro optimalizaci. |
Pravidelná váha L1 | >= 0,0 | Float | 1.0 | Zadejte váhu pravidelného navýšení L1. Nenulovou hodnotu použijte, chcete-li se vyhnout přebudování. |
Váha pro pravidelnost L2 | >= 0,0 | Float | 1.0 | Zadejte váhu pravidelného L2. Nenulovou hodnotu použijte, chcete-li se vyhnout přebudování. |
Velikost paměti pro L-BFGS | >= 1 | Integer | 20 | Zadejte velikost paměti (v MB), která se použije pro Optimalizátor L-BFGS. Pokud se používá méně paměti, je školení rychlejší, ale je méně přesné. |
Počáteční počáteční číslo | Všechny | Integer | Zadejte hodnotu pro počáteční generátor náhodných čísel používaný modelem. Pro výchozí ponechte pole prázdné. | |
Povolení neznámých úrovní kategorií | Všechny | Logická hodnota | Ano | Určuje, zda má být pro každý sloupec kategorií vytvořená další úroveň. Všechny úrovně v testovací sadě, které nejsou k dispozici v datové sadě školení, jsou namapovány na tuto další úroveň. |
Výstupy
Název | Typ | Description |
---|---|---|
Nevlakový model | Rozhraní ILearner | Nevlakový model klasifikace |
Viz také
Classification
Logistická regrese se dvěma třídami
Seznam modulů a-Z