Sdílet prostřednictvím


Two-Class Decision Můžete

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Vytvoří klasifikační model se dvěma třídami pomocí algoritmu rozhodovacího algoritmu.

Kategorie: Machine Learning / Inicializovat model / klasifikaci

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Přehled modulu

Tento článek popisuje, jak pomocí modulu Two-Class Decision Module v Machine Learning Studiu (klasickém) vytvořit model strojového učení, který je založený na algoritmu souborového učení pod dohledem, který se označuje jako rozhodovací náhlá.

Modul Two-Class DecisionAl vrátí netrénovaný klasifikátor. Pak tento model vytrénujete na trénovací trénovací sadě s popiskem pomocí trénování modelu nebo ladění hyperparametrů modelu. Vytrénovaný model pak můžete použít k předpovědí.

Další informace o rozhodovacích zařízeních

Rozhodovací struktury jsou nedávným rozšířením rozhodovacích doménových struktur. Rozhodovací seznam se skládá ze souboru acyklických grafů (DAG) směřované na rozhodování.

Rozhodnutí mají následující výhody:

  • Díky tomu, že umožňuje sloučení větví stromové struktury, má rozhodovací dag obvykle nižší nároky na paměť a lepší výkon zobecnění než rozhodovací strom, i když za cenu o něco delší doby trénování.

  • Rozhodovací sítě jsou neparametrické modely, které mohou představovat nelineární rozhodovací hranice.

  • Provádí integrovaný výběr a klasifikaci funkcí a jsou odolné v případě hlučných funkcí.

Tip

Další informace o výzkumu tohoto algoritmu strojového učení najdete v článku Rozhodovacíci: Kompaktní a bohaté modely pro klasifikaci (pdf ke stažení).

Konfigurace rozhodovacího Two-Class

  1. Přidejte do experimentu v nástroji Studio (classic) modul Decision Module se dvěma třídami.

  2. V případě metody převzorkování zvolte metodu použitou k vytvoření jednotlivých stromů. Můžete si vybrat z nabídky Bagging nebo Replicate ( Replikovat).

    • Bagging (Označení): Tuto možnost vyberte, pokud chcete použít bagging (tzv. bootstrap aggregating).

      Každý strom v rozhodovacím uzlu jako predikci vyjádře Gaussova rozdělení. Agregací je najít Gaussova, jehož první dva okamžiky odpovídají momentům kombinace Gaussových kombinací všech Gaussianů vrácených jednotlivými stromy.

    • Replikace: Při replikaci se každý strom trénuje na přesně stejných vstupních datech. Určení, který dělený predikát se používá pro každý uzel stromu, zůstává náhodné a stromy budou různorodé.

      Další informace najdete v článku Rozhodovací doménové struktury pro Počítačové zpracování obrazu a analýzu lékařských obrázků. Criminisi a J. Shotton. Springer 2013.

  3. Nastavením možnosti Vytvořit režim školitele určete, jak chcete model vytrénovat.

    • Jeden parametr: Pokud víte, jak chcete model nakonfigurovat, můžete zadat konkrétní sadu hodnot jako argumenty.

    • Rozsah parametrů: Pokud si nejste jistí nejlepšími parametry, můžete najít optimální parametry zadáním více hodnot a použitím modulu Tune Model Hyperparameters (Ladění hyperparametrů modelu) k vyhledání optimální konfigurace. Školitel bude iterovat přes několik kombinací nastavení, která jste poskytli, a určí kombinaci hodnot, které vytváří nejlepší model.

  4. V části Number of decision DAG (Počet rozhodovacích dag) určete maximální počet grafů, které je možné vytvořit ve směsi.

  5. V části Maximální hloubka rozhodovacích dagů určete maximální hloubku každého grafu.

  6. V části Maximální šířka rozhodovacích dagů určete maximální šířku každého grafu.

  7. V části Počet kroků optimalizace na rozhodovací vrstvu DAG určete, kolik iterací dat se má provést při vytváření jednotlivých dag.

  8. Výběrem možnosti Povolit neznámé hodnoty pro kategorické funkce vytvořte skupinu pro neznámé hodnoty v testovacích nebo ověřovacích datech.

    Pokud jeho výběr zrušíte, model může přijmout pouze hodnoty, které jsou obsaženy v trénovací data. V dřívějším případě může být model pro známé hodnoty méně přesný, ale může poskytovat lepší předpovědi pro nové (neznámé) hodnoty.

  9. Přidejte do experimentu označenou datovou sadu a připojte jeden z trénovacích modulů.

    Poznámka

    Pokud předáte rozsah parametrů do trénového modelu, použije se pouze první hodnota v seznamu rozsahů parametrů.

    Pokud modulu Vyladění modelu hyperparametrů předáte jednu sadu hodnot parametrů, bude modul, který očekává rozsah nastavení pro každý parametr, ignorovat tyto hodnoty a použije výchozí hodnoty pro toho, kdo se učí.

    Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se tato jedna hodnota, kterou jste zadali v průběhu úklidu, i když se jiné parametry v rozsahu hodnot změní.

Výsledky

Po dokončení trénování:

  • Pokud chcete použít model pro bodování, připojte ho ke score modelu, abyste předpověděli hodnoty pro nové vstupní příklady.

Příklady

Příklady toho, jak se ve strojové učení používají rozhodovací Azure AI Gallery:

Technické poznámky

Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.

Tipy k používání

Pokud máte omezená data nebo chcete minimalizovat čas strávený trénování modelu, vyzkoušejte tato nastavení.

Omezená trénovací sada

Pokud je vaše trénovací sada malá:

  • Vytvořte rozhodovací pravidlo pomocí velkého počtu rozhodovacích dagů (například více než 20).
  • K převzorkování použijte možnost Bagging .)
  • Zadejte velký počet kroků optimalizace na vrstvu DAG (například více než 10 000).

Omezená doba trénování

Pokud je trénovací sada velká, ale doba trénování je omezená:

  • Vytvořte rozhodovací pravidlo s menším počtem rozhodovacích dagů (například 5–10).
  • Pro převzorkování použijte možnost Replikovat.
  • Zadejte menší počet kroků optimalizace na vrstvu DAG (například menší než 2000).

Parametry modulu

Name Rozsah Typ Výchozí Description
Metoda převzorkování Všechny Metoda převzorkování Pytlování Volba metody převzorkování
Počet dagů pro rozhodování >=1 Integer 8 Určení počtu rozhodovacích grafů, které se sestaví ve hromadě
Maximální hloubka rozhodovacích dag >=1 Integer 32 Určení maximální hloubky rozhodovacích grafů ve směsi
Maximální šířka rozhodovacích dagů >= 8 Integer 128 Zadejte maximální šířku grafů rozhodnutí v kompletu.
Počet kroků optimalizace na DAG vrstvu na rozhodnutí >= 1000 Integer 2 048 Zadejte počet kroků, které se mají použít k optimalizaci jednotlivých úrovní grafů rozhodnutí.
Povolení neznámých hodnot pro funkce kategorií Všechny Logická hodnota Ano Určuje, jestli je možné namapovat neznámé hodnoty existujících funkcí kategorií na novou, další funkci.

Výstup

Název Typ Description
Nevlakový model Rozhraní ILearner Nevýukový binární klasifikační model

Viz také

Classification
Jungle rozhodnutí pro více tříd
Seznam modulů a-Z