Posílený rozhodovací strom s několika třídami

Tento článek popisuje komponentu v návrháři služby Azure Machine Learning.

Tato komponenta slouží k vytvoření modelu strojového učení, který je založený na algoritmu zesílených rozhodovacích stromů.

Zesílený rozhodovací strom je metoda učení souboru, ve které druhý strom opravuje chyby prvního stromu, třetí strom opravuje chyby prvního a druhého stromu a tak dále. Predikce jsou založeny na souboru stromů společně.

Způsob konfigurace

Tato komponenta vytvoří netrénovaný klasifikační model. Vzhledem k tomu, že klasifikace je metoda učení pod dohledem, potřebujete datovou sadu s popiskem , která obsahuje sloupec popisku s hodnotou pro všechny řádky.

Tento typ modelu můžete trénovat pomocí trénování modelu.

  1. Přidejte do kanálu komponentu Vícetřídní posílený rozhodovací strom .

  2. Nastavením možnosti Vytvořit režim školitele určete, jak se má model trénovat.

    • Jeden parametr: Pokud víte, jak chcete model nakonfigurovat, můžete jako argumenty zadat konkrétní sadu hodnot.

    • Rozsah parametrů: Tuto možnost vyberte, pokud si nejste jistí nejlepšími parametry a chcete spustit úklid parametrů. Vyberte rozsah hodnot, které chcete iterovat, a hyperparametry tune modelu iteruje všechny možné kombinace nastavení, které jste zadali, a určí hyperparametry, které generují optimální výsledky.

  3. Maximální počet listů na strom omezuje maximální počet koncových uzlů (listů), které lze vytvořit v libovolném stromu.

    Zvýšením této hodnoty potenciálně zvětšíte velikost stromu a dosáhnete vyšší přesnosti s rizikem přeurčení a delšího trénování.

  4. Minimální počet vzorků na uzel typu list označuje počet případů potřebných k vytvoření libovolného koncového uzlu (listu) ve stromu.

    Zvýšením této hodnoty zvýšíte prahovou hodnotu pro vytváření nových pravidel. Například s výchozí hodnotou 1 může i jeden případ způsobit vytvoření nového pravidla. Pokud hodnotu zvýšíte na 5, trénovací data by musela obsahovat alespoň pět případů, které splňují stejné podmínky.

  5. Rychlost učení definuje velikost kroku při učení. Zadejte číslo mezi 0 a 1.

    Rychlost učení určuje, jak rychle nebo pomalu se učící konverguje na optimálním řešení. Pokud je velikost kroku příliš velká, můžete optimální řešení překroutit. Pokud je velikost kroku příliš malá, trénování trvá déle, než se shodí s nejlepším řešením.

  6. Počet vytvořených stromů označuje celkový počet rozhodovacích stromů, které se mají vytvořit v souboru. Vytvořením více rozhodovacích stromů můžete potenciálně získat lepší pokrytí, ale doba trénování se zvýší.

  7. Náhodné počáteční číslo volitelně nastaví nezáporné celé číslo, které se použije jako náhodná počáteční hodnota. Zadání počáteční hodnoty zajišťuje reprodukovatelnost napříč spuštěními, která mají stejná data a parametry.

    Náhodné počáteční hodnoty jsou ve výchozím nastavení nastaveny na hodnotu 42. Po sobě jdoucí běhy s použitím různých náhodných semen můžou mít různé výsledky.

  8. Trénování modelu:

    • Pokud nastavíte Vytvořit režim školitele na jeden parametr, propojte označenou datovou sadu a komponentu Trénování modelu .

    • Pokud nastavíte Vytvořit režim školitele na Rozsah parametrů, připojte označenou datovou sadu a vytrénujte model pomocí ladění hyperparametrů modelu.

    Poznámka

    Pokud do trénování modelu předáte rozsah parametrů, použije se pouze výchozí hodnota v seznamu s jedním parametrem.

    Pokud předáte jednu sadu hodnot parametrů do komponenty Tune Model Hyperparameters , pokud očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro learner.

    Pokud vyberete možnost Rozsah parametrů a zadáte jednu hodnotu pro libovolný parametr, použije se tato jedna hodnota, kterou jste zadali, v průběhu úklidu, i když se jiné parametry v rozsahu hodnot mění.

Další kroky

Projděte si sadu komponent dostupných pro Azure Machine Learning.