Wieloklasowe wzmocnione drzewo decyzyjne
W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.
Użyj tego składnika, aby utworzyć model uczenia maszynowego oparty na wzmocnionym algorytmie drzew decyzyjnych.
Wzmocnione drzewo decyzyjne to metoda uczenia zespołowego, w której drugie drzewo poprawia błędy pierwszego drzewa, trzecie drzewo poprawia błędy pierwszych i drugich drzew itd. Przewidywania są oparte na zestawie drzew razem.
Sposób konfigurowania
Ten składnik tworzy nietrenowany model klasyfikacji. Ponieważ klasyfikacja jest metodą uczenia nadzorowanego, potrzebujesz oznaczonego zestawu danych zawierającego kolumnę etykiety z wartością dla wszystkich wierszy.
Ten typ modelu można wytrenować przy użyciu trenowania modelu.
Dodaj składnik Wieloklasowe wzmocnione drzewo decyzyjne do potoku.
Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .
Pojedynczy parametr: jeśli wiesz, jak skonfigurować model, możesz podać określony zestaw wartości jako argumenty.
Zakres parametrów: wybierz tę opcję, jeśli nie masz pewności co do najlepszych parametrów i chcesz uruchomić zamiatanie parametrów. Wybierz zakres wartości do iterowania, a hiperparametry modelu dostrajania iterują we wszystkich możliwych kombinacjach podanych ustawień w celu określenia hiperparametrów, które generują optymalne wyniki.
Maksymalna liczba liści na drzewo ogranicza maksymalną liczbę węzłów terminalowych (liści), które można utworzyć w dowolnym drzewie.
Zwiększając tę wartość, potencjalnie zwiększasz rozmiar drzewa i osiągasz większą precyzję, ryzykując nadmierne dopasowanie i dłuższy czas trenowania.
Minimalna liczba próbek na węzeł liścia wskazuje liczbę przypadków wymaganych do utworzenia dowolnego węzła terminalowego (liścia) w drzewie.
Zwiększając tę wartość, zwiększasz próg tworzenia nowych reguł. Na przykład z wartością domyślną 1, nawet pojedynczy przypadek może spowodować utworzenie nowej reguły. Jeśli zwiększysz wartość do 5, dane szkoleniowe będą musiały zawierać co najmniej pięć przypadków spełniających te same warunki.
Szybkość nauki definiuje rozmiar kroku podczas nauki. Wprowadź liczbę z zakresu od 0 do 1.
Szybkość nauki określa szybkość lub spowolnienie zbieżność ucznia z optymalnym rozwiązaniem. Jeśli rozmiar kroku jest zbyt duży, możesz przesłonić optymalne rozwiązanie. Jeśli rozmiar kroku jest za mały, trenowanie trwa dłużej, aby zbiegać się z najlepszym rozwiązaniem.
Liczba skonstruowanych drzew wskazuje całkowitą liczbę drzew decyzyjnych do utworzenia w zespole. Tworząc więcej drzew decyzyjnych, możesz potencjalnie uzyskać lepsze pokrycie, ale czas trenowania wzrośnie.
Inicjator liczb losowych opcjonalnie ustawia nieujemną liczbę całkowitą, która ma być używana jako losowa wartość inicjowania. Określenie inicjatora zapewnia powtarzalność między przebiegami, które mają te same dane i parametry.
Losowe inicjatory są domyślnie ustawione na 42. Kolejne przebiegi przy użyciu różnych losowych nasion mogą mieć różne wyniki.
Trenowanie modelu:
Jeśli ustawisz opcję Utwórz tryb trenera na Pojedynczy parametr, połącz oznakowany zestaw danych i składnik Train Model (Trenowanie modelu).
Jeśli ustawisz opcję Utwórz tryb trenera na Wartość Zakres parametrów, połącz oznakowany zestaw danych i wytrenuj model przy użyciu hiperparametrów dostrajania modelu.
Uwaga
Jeśli przekażesz zakres parametrów do trenowania modelu, zostanie użyta tylko wartość domyślna na liście pojedynczych parametrów.
Jeśli przekażesz pojedynczy zestaw wartości parametrów do składnika hiperparametrów modelu dostrajania , gdy oczekuje ona zakresu ustawień dla każdego parametru, zignoruje wartości i używa wartości domyślnych dla ucznia.
Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, określona pojedyncza wartość jest używana w trakcie zamiatania, nawet jeśli inne parametry zmienią się w zakresie wartości.
Następne kroki
Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.