Wieloklasowe wzmocnione drzewo decyzyjne

W tym artykule opisano składnik w projektancie usługi Azure Machine Learning.

Użyj tego składnika, aby utworzyć model uczenia maszynowego oparty na wzmocnionym algorytmie drzew decyzyjnych.

Wzmocnione drzewo decyzyjne to metoda szkoleniowa zespołu, w której drugie drzewo poprawia błędy pierwszego drzewa, trzecie drzewo poprawia błędy pierwszych i drugich drzew, itd. Przewidywania są oparte na zestawie drzew razem.

Sposób konfigurowania

Ten składnik tworzy nietrenowany model klasyfikacji. Ponieważ klasyfikacja jest metodą uczenia nadzorowanego, potrzebny jest oznaczony zestaw danych zawierający kolumnę etykiety z wartością dla wszystkich wierszy.

Ten typ modelu można wytrenować przy użyciu trenowania modelu.

  1. Dodaj składnik Wieloklasowego wzmocnionego drzewa decyzyjnego do potoku.

  2. Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb trenera .

    • Pojedynczy parametr: jeśli wiesz, jak skonfigurować model, możesz podać określony zestaw wartości jako argumenty.

    • Zakres parametrów: wybierz tę opcję, jeśli nie masz pewności co do najlepszych parametrów i chcesz uruchomić zamiatanie parametrów. Wybierz zakres wartości do iterowania, a hiperparametry modelu dostrajania iterują wszystkie możliwe kombinacje podanych ustawień w celu określenia hiperparametrów, które generują optymalne wyniki.

  3. Maksymalna liczba liści na drzewo ogranicza maksymalną liczbę węzłów terminalu (liści), które można utworzyć w dowolnym drzewie.

    Zwiększając tę wartość, potencjalnie zwiększasz rozmiar drzewa i osiągasz większą precyzję, ryzykując nadmierne dopasowanie i dłuższy czas trenowania.

  4. Minimalna liczba próbek na węzeł liścia wskazuje liczbę przypadków wymaganych do utworzenia dowolnego węzła terminalu (liścia) w drzewie.

    Zwiększając tę wartość, zwiększasz próg tworzenia nowych reguł. Na przykład z wartością domyślną 1, nawet pojedynczy przypadek może spowodować utworzenie nowej reguły. Jeśli zwiększysz wartość do 5, dane szkoleniowe będą musiały zawierać co najmniej pięć przypadków spełniających te same warunki.

  5. Szybkość nauki definiuje rozmiar kroku podczas nauki. Wprowadź liczbę z zakresu od 0 do 1.

    Szybkość nauki określa szybkość lub spowolnienie zbieżność ucznia w optymalnym rozwiązaniu. Jeśli rozmiar kroku jest zbyt duży, możesz przesłonić optymalne rozwiązanie. Jeśli rozmiar kroku jest zbyt mały, trenowanie trwa dłużej, aby zbiegać się z najlepszym rozwiązaniem.

  6. Liczba skonstruowanych drzew wskazuje łączną liczbę drzew decyzyjnych do utworzenia w zespole. Tworząc więcej drzew decyzyjnych, możesz potencjalnie uzyskać lepszy zasięg, ale czas szkolenia wzrośnie.

  7. Losowe ziarno liczbowe opcjonalnie ustawia nie ujemną liczbę całkowitą do użycia jako losową wartość nasion. Określenie nasion zapewnia powtarzalność między przebiegami, które mają te same dane i parametry.

    Losowy nasion jest domyślnie ustawiony na 42. Kolejne przebiegi używające różnych losowych nasion mogą mieć różne wyniki.

  8. Trenowanie modelu:

    • Jeśli ustawisz opcję Utwórz tryb trenera na pojedynczy parametr, połącz oznakowany zestaw danych i składnik Train Model .

    • Jeśli ustawisz opcję Utwórz tryb trenera na wartość Zakres parametrów, połącz oznakowany zestaw danych i wytrenuj model przy użyciu hiperparametrów tune model.

    Uwaga

    Jeśli przekazujesz zakres parametrów do trenowania modelu, używa tylko wartości domyślnej na liście pojedynczych parametrów.

    Jeśli przekazujesz jeden zestaw wartości parametrów do składnika Hiperparametry modelu dostrajania , gdy oczekuje on zakresu ustawień dla każdego parametru, ignoruje wartości i używa wartości domyślnych dla ucznia.

    Jeśli wybierzesz opcję Zakres parametrów i wprowadzisz pojedynczą wartość dla dowolnego parametru, ta określona wartość jest używana w całym zamiataniu, nawet jeśli inne parametry zmieniają się w zakresie wartości.

Następne kroki

Zobacz zestaw składników dostępnych dla usługi Azure Machine Learning.