Logistická regrese se dvěma třídami
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Vytvoří model logistické regrese se dvěma třídami
kategorie: Machine Learning/inicializovat Model/klasifikace
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Přehled modulu
tento článek popisuje, jak v Machine Learning studiu (classic) použít modul logistické regrese se dvěma třídami k vytvoření modelu logistické regrese, který se dá použít k předpovědi dvou (a jenom dvou) výsledků.
Logistická regrese je dobře známá statistická technika, která se používá k modelování mnoha druhů problémů. Tento algoritmus je metoda učení pod dohledem ; Proto je nutné poskytnout datovou sadu, která již obsahuje výsledky pro výuku modelu.
Další informace o logistické regresi
Logistická regrese je dobře známá metoda, která se používá k předpovědi pravděpodobnosti výsledku, a je obzvláště oblíbená pro úlohy klasifikace. Algoritmus předpovídá pravděpodobnost výskytu události tím, že se data namontuje na logistickou funkci. Podrobnosti o této implementaci najdete v části technické poznámky .
V tomto modulu je klasifikační algoritmus optimalizovaný pro dichotomous nebo binární proměnné. Pokud potřebujete klasifikovat více výsledků, použijte modul logistické regrese pro více tříd.
Jak nakonfigurovat Two-Class logistické regrese
Chcete-li tento model naučit, je nutné poskytnout datovou sadu, která obsahuje sloupec popisku nebo třídy. Vzhledem k tomu, že tento modul je určený pro problémy se dvěma třídami, sloupec popisku nebo třídy musí obsahovat přesně dvě hodnoty.
Sloupec popisku může být například [hlasovalo] s možnými hodnotami "Ano" nebo "ne". Nebo může to být [úvěrové riziko] s možnými hodnotami "vysoká" nebo "nízká".
Přidejte modul logistické regrese dvou tříd do experimentu v studiu (Classic).
Určete, jak chcete model vyškolet nastavením možnosti vytvořit Trainer režim .
Jediný parametr: Pokud víte, jak chcete model konfigurovat, můžete zadat konkrétní sadu hodnot jako argumenty.
Rozsah parametrů: Pokud si nejste jisti nejlepšími parametry, můžete najít optimální parametry zadáním více hodnot a pomocí modulu ladění modelu předparametrů vyhledat optimální konfiguraci. Trainer projde více kombinací nastavení a určí kombinaci hodnot, které vytvářejí nejlepší model.
V případě tolerance optimalizacezadejte mezní hodnotu, která se má použít při optimalizaci modelu. Pokud vylepšení mezi iteracemi klesne pod zadanou prahovou hodnotu, je algoritmus považován za sblížený v řešení a školení se zastaví.
Pro váhu regulárních hodnot L1 a váhu pravidelného použití L2zadejte hodnotu, která se má použít pro parametry pro pravidelnost L1 a L2. Pro obojí se doporučuje nenulová hodnota.
Pravidelná metoda představuje způsob, jak zabránit přeložení pomocí postihu modelů s hodnotami extrémního součinitele. Pravidelnou práci můžete provést přidáním pokuty, která je spojená s hodnotami koeficientu, na chybu hypotézy. Přesný model s hodnotami extrémních koeficientů by tedy byl potrestánější, ale méně přesný model s více konzervativními hodnotami by byl méně trestný.
Pravidelná L1 a L2 mají různé účinky a použití.
L1 se dá použít na řídké modely, což je užitečné při práci s vysokými objemy dat.
Na rozdíl od je pro data, která nejsou zhuštěná, vhodnější pravidelná navýšení L2.
Tento algoritmus podporuje lineární kombinaci hodnot L1 a L2 pro účely depravidelnosti: to znamená, že pokud
x = L1
ay = L2
, pakax + by = c
definuje lineární rozpětí regulárních podmínek.Poznámka
Chcete získat další informace o L1 a propravidelnosti L2? Následující článek poskytuje diskuzi o tom, jak se v proneuronovéch L1 a L2 liší a jak mají vliv na model, s ukázkami kódu pro logistické regrese a síťové modely: L1 a L2 pro Machine Learning
Pro logistické regresní modely byly navrženy různé lineární kombinace L1 a L2: například elastické čistéúčely. Doporučujeme, abyste na tyto kombinace odkazovali a definovali lineární kombinaci, která je v modelu platná.
Pro velikost paměti pro l-BFGSurčete velikost paměti, která se má použít pro optimalizaci l-BFGS .
L-BFGS představuje "omezené paměťové Broyden-Fletcher-Goldfarb-Shanno". Jedná se o optimalizační algoritmus, který je oblíbený pro odhad parametru. Tento parametr určuje počet minulých pozic a přechodů, které se mají uložit pro výpočet dalšího kroku.
Tento parametr optimalizace omezuje velikost paměti, která se používá k výpočtu dalšího kroku a směru. Když zadáte méně paměti, školení je rychlejší, ale je méně přesné.
V případě náhodného číslazadejte celočíselnou hodnotu. Definování počáteční hodnoty je důležité, pokud chcete, aby byly výsledky reprodukovatelné na více spuštěních stejného experimentu.
Vyberte možnost Povolení neznámých úrovní kategorií a vytvořte v každém sloupci kategorií další "neznámou úroveň". Pokud to uděláte, všechny hodnoty (úrovně) v testovací sadě, které nejsou k dispozici v datové sadě školení, jsou namapovány na tuto "neznámou" úroveň.
Přidejte do experimentu tagované datové sady a propojte jeden ze školicích modulů.
Pokud nastavíte režim vytvořit Trainer na jeden parametr, použijte modul vlakového modelu .
Pokud nastavíte režim vytvořit Trainer na rozsah parametrů, použijte modul ladit model s parametry .
Poznámka
Pokud předáte rozsah parametru pro vlakový model, použije se v seznamu rozsah parametrů jenom první hodnota.
Pokud předáte jednu sadu hodnot parametrů do modulu předparametrů modelu ladění , když očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro učit se.
Pokud vyberete možnost rozsahu parametrů a zadáte jednu hodnotu pro libovolný parametr, bude se tato jediná hodnota, kterou jste zadali, používat v celém období, a to i v případě, že se jiné parametry mění v rozsahu hodnot.
Spusťte experiment.
Výsledky
Po dokončení školení:
Chcete-li zobrazit souhrn parametrů modelu spolu s váhy funkcí zjištěnými ze školení, klikněte pravým tlačítkem myši na výstup vlakové soupravy nebo ladit modely parametrůa vyberte vizualizovat.
Chcete-li vytvořit předpovědi pro nová data, použijte školený model a nová data jako vstup do modulu určení skóre modelu .
Chcete-li provést křížové ověření proti označené datové sadě, připojte data a nevýukový model k modelu křížového ověřování.
Příklady
Příklady toho, jak se tento algoritmus výuky používá, najdete v Azure AI Gallery:
Zjišťování neoprávněných vniknutí k síti: používá binární logistickou regresi k určení, zda případ představuje neoprávněný vniknutí.
Křížové ověřování pro binární třídění: demonstruje použití logistické regrese v typickém experimentálním pracovním postupu, včetně vyhodnocení modelu.
Technické poznámky
Tato část obsahuje podrobné informace o implementaci, tipy a odpovědi na nejčastější dotazy.
Tipy k použití
Logistická regrese vyžaduje číselné proměnné. proto když použijete sloupce kategorií jako proměnnou, Machine Learning převede hodnoty na pole indikátoru interně.
Pro data a časy se používá číselná reprezentace. (další informace o hodnotách data a času naleznete v tématu struktura DateTime (.NET Framework)-poznámky.) Pokud chcete zpracovávat data a časy odlišně, doporučujeme vytvořit odvozený sloupec.
Podrobnosti o implementaci
Logistická regrese předpokládá logistickou distribuci dat, kde pravděpodobnost, kterou příklad patří do třídy 1, je vzorec:
p(x;β0,…, βD-1)
Kde:
x
je multidimenzionální vektor obsahující hodnoty všech funkcí instance.p
je funkce logistické distribuce.β{0},..., β {D-1}
jsou neznámé parametry distribuce logistiky.
Algoritmus se pokusí najít optimální hodnoty pro β{0},..., β {D-1}
tím, že maximalizuje pravděpodobnost protokolu u parametrů daných vstupy. Omezení je prováděno pomocí oblíbené metody pro odhad parametru s názvem omezený BFGS paměti.
Studoval
Další informace o implementaci tohoto algoritmu najdete v tématu škálovatelné školení L-1 regulérních Log-Linear modelů, od Andrew a Gao.
Parametry modulu
Name | Rozsah | Typ | Výchozí | Description |
---|---|---|---|---|
Tolerance optimalizace | >=double. Epsilon | Float | 0.0000001 | Určení hodnoty tolerance pro optimalizátor L-BFGS |
Váha regularizace L1 | >=0,0 | Float | 1.0 | Určení váhy regularizace L1 |
Váha regularizace L2 | >=0,0 | Float | 1.0 | Určení váhy regularizace L2 |
Velikost paměti pro L-BFGS | >=1 | Integer | 20 | Zadejte velikost paměti (v MB), která se má použít pro optimalizátor L-BFGS. |
Přediména náhodného čísla | Všechny | Integer | Zadejte hodnotu, která se použije pro generátor náhodných čísel používaný modelem. Ponechte výchozí hodnotu prázdnou. | |
Povolit neznámé úrovně kategorií | Všechny | Logická hodnota | Ano | Určete, jestli se má pro každý sloupec kategorií vytvořit další úroveň. Všechny úrovně v testovací datové sadě, které nejsou k dispozici v trénovací datové sadě, se mapují na tuto další úroveň. |
Výstup
Název | Typ | Description |
---|---|---|
Model bez trénování | ILearner – rozhraní | Model klasifikace bez trénování |