Udostępnij za pośrednictwem


Wieloklasowe decyzje

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Tworzy wieloklasowy model klasyfikacji przy użyciu algorytmu algorytmu podejmowania decyzji

Kategoria: Machine Learning/ Inicjowanie modelu/klasyfikacji

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano, jak za pomocą modułu Multiclass Decision Model w programie Machine Learning Studio (wersja klasyczna) utworzyć model uczenia maszynowego oparty na nadzorowym algorytmie uczenia nazywanym systemami decyzyjnymi.

Model i jego parametry definiuje się przy użyciu tego modułu, a następnie łączysz zestaw danych treningowych z etykietami w celu trenowania modelu przy użyciu jednego z modułów szkoleniowych. Wytrenowany model może służyć do przewidywania celu, który ma wiele wartości.

Więcej informacji o procesach decyzyjnych

Lasy decyzyjne to niedawne rozszerzenie lasów decyzyjnych. Proces decyzyjny składa się z grupy grafów acyklicznych (DAG, decision directed acyclic graph).

Decyzje mają następujące zalety:

  • Zezwalając gałęziom drzewa na scalanie, decyzje dag zwykle mają mniejsze zużycie pamięci i lepszą wydajność uogólniania niż drzewo decyzyjne, chociaż kosztem nieco wyższego czasu trenowania.

  • Przedsiębiorstwa decyzyjne są modelami nieparametrycznymi, które mogą reprezentować nieliniowe granice decyzyjne.

  • Wykonują one zintegrowane operacje wyboru i klasyfikacji funkcji oraz są odporne w obecności hałaśliwych funkcji.

Aby uzyskać więcej informacji na temat badań na podstawie tego algorytmu uczenia maszynowego, zobacz Decision Systems: Compact and Rich Models for Classification (Modele decyzji: kompaktowanie i rozbudowane modele klasyfikacji) (plik PDF do pobrania).

How to configure Multiclass Decision Model (Jak skonfigurować wieloklasowy model decision model)

  1. Dodaj moduł Multiclass Decision Module (Wieloklasowy proces podejmowania decyzji ) do eksperymentu w programie Studio (wersja klasyczna). Ten moduł można znaleźć w Machine Learning,Inicjowanie modelu i Klasyfikacja.

  2. Kliknij dwukrotnie moduł, aby otworzyć okienko Właściwości.

  3. Ponownie próbkowanie metody, wybierz metodę tworzenia wielu drzew, wsadu lub replikacji.

    • Bagging (Bagging): wybierz tę opcję, aby użyć funkcji bagging, nazywanej również agregowaniem bootstrap.

      Każde drzewo w lesie decyzyjnym wyprowadza rozkład gaussański na drodze przewidywania. Agregacja to znalezienie Gaussona, którego pierwsze dwa momenty pasują do momentów kombinacji gaussów podanych przez połączenie wszystkich gaussów zwracanych przez poszczególne drzewa.

    • Replikuj: wybierz tę opcję, aby użyć replikacji. W tej metodzie każde drzewo jest trenowane na dokładnie tych samych danych wejściowych. Określenie, który predykat podzielony jest używany dla każdego węzła drzewa, pozostaje losowe, więc tworzone są różnorodne drzewa.

  4. Określ sposób trenowania modelu, ustawiając opcję Utwórz tryb szkoleniowy .

    • Pojedynczy parametr: użyj tej opcji, jeśli wiesz, jak chcesz skonfigurować model.

    • Zakres parametrów: użyj tej opcji, jeśli nie masz pewności co do najlepszych parametrów i chcesz użyć funkcji czyszczenie parametrów.

  5. Liczba dag decyzyjnych: wskazuje maksymalną liczbę grafów, które można utworzyć w zespole.

  6. Maksymalna głębokość decyzyjnych dag: określ maksymalną głębokość każdego grafu.

  7. Maksymalna szerokość decyzyjnych dag: określ maksymalną szerokość każdego grafu.

  8. Liczba kroków optymalizacji na warstwę daG decyzji: wskazuje liczbę iteracji danych do wykonania podczas tworzenia poszczególnych procesów DAG.

  9. Zezwalaj na nieznane wartości dla funkcji kategorii: wybierz tę opcję, aby utworzyć grupę dla nieznanych wartości w danych testowania lub walidacji. Model może być mniej dokładny dla znanych wartości, ale może zapewnić lepsze przewidywania dla nowych (nieznanych) wartości.

    W przypadku zaznaczenia tej opcji model może akceptować tylko wartości, które były obecne w danych szkoleniowych.

  10. Połączenie zestaw danych z etykietami i jeden z modułów szkoleniowych:

    • Jeśli ustawisz tryb Tworzenia instruktora na wartość Pojedynczy parametr, użyj modułu Train Model (Trenowanie modelu).

    • Jeśli ustawisz ustawienie Utwórz tryb instruktora na wartość Zakres parametrów, użyj modułu Hiperparametry modelu dostrajania . W przypadku tej opcji algorytm iteruje po wielu kombinacjach podanych ustawień i określa kombinację wartości, która tworzy najlepszy model.

    Uwaga

    Jeśli przekażemy zakres parametrów do funkcji Train Model, będzie używana tylko pierwsza wartość z listy zakresów parametrów.

    Jeśli przekażemy pojedynczy zestaw wartości parametrów do modułu Hiperparametry modelu dostrajania, jeśli oczekuje on zakresu ustawień dla każdego parametru, zignoruje wartości i użyje wartości domyślnych dla uczących się.

    W przypadku wybrania opcji Zakres parametrów i wprowadzenia pojedynczej wartości dla dowolnego parametru określona pojedyncza wartość będzie używana podczas całej czyszczenie, nawet jeśli inne parametry zmienią się w zakresie wartości.

  11. Uruchom eksperyment.

Wyniki

Po zakończeniu szkolenia:

  • Aby użyć modelu do oceniania, połącz go z modelem Score Model (Ocena modelu) w celu przewidywania wartości dla nowych przykładów wejściowych.

Przykłady

Aby uzyskać przykłady dotyczące sposobu, w jaki lasy decyzyjne są używane w uczeniu maszynowym, zobacz Azure AI Gallery:

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.

Aby uzyskać więcej informacji na temat procesu trenowania przy użyciu opcji Replikuj , zobacz:

Porady dotyczące użycia

Jeśli masz ograniczone dane lub chcesz zminimalizować czas trenowania modelu, wypróbuj następujące zalecenia:

Ograniczony zestaw treningowy

Jeśli zestaw szkoleniowy zawiera ograniczoną liczbę wystąpień:

  • Utwórz decyzje przy użyciu dużej liczby grupy DAG decyzji (na przykład ponad 20)
  • Użyj opcji Bagging w celu ponownego próbkowania.
  • Określ dużą liczbę kroków optymalizacji na warstwę DAG (na przykład ponad 10 000).

Ograniczony czas trenowania

Jeśli zestaw szkoleniowy zawiera dużą liczbę wystąpień, a czas trenowania jest ograniczony:

  • Utwórz decyzje wykorzystujące mniejszą liczbę decyzyjnych grupy DAG (na przykład 5–10).
  • Użyj opcji Replikuj do ponownego próbkowania.
  • Określ mniejszą liczbę kroków optymalizacji na warstwę DAG (na przykład mniejszą niż 2000).

Parametry modułu

Nazwa Zakres Typ Domyślny Opis
Metoda ponownego próbkowania Dowolne ResamplingMethod Pakowania Wybieranie metody ponownego próbkowania
Liczba decyzje DAG >= 1 Liczba całkowita 8 Określ liczbę wykresów decyzyjnych, które można utworzyć w zespole
Maksymalna głębokość decyzyjnych dag >= 1 Liczba całkowita 32 Określ maksymalną głębokość wykresów decyzyjnych do utworzenia w zespole
Maksymalna szerokość decyzje dag >= 8 Liczba całkowita 128 Określ maksymalną szerokość wykresów decyzyjnych do utworzenia w zespole
Liczba kroków optymalizacji na warstwę dag decyzji >= 1000 Liczba całkowita 2048 Określ liczbę kroków, które należy wykonać, aby zoptymalizować każdy poziom wykresów decyzyjnych
Zezwalaj na nieznane wartości dla cech kategorii Dowolne Boolean Prawda Wskazanie, czy nieznane wartości istniejących cech kategorii mogą być mapowane na nową, dodatkową funkcję

Dane wyjściowe

Nazwa Typ Opis
Nie wytrenowany model ILearner, interfejs Nieprzeszkolony model klasyfikacji wieloklasowej

Zobacz też

Two-Class Decision Zamów
Klasyfikacja
Lista modułów A–Z