Udostępnij za pośrednictwem


Two-Class Bayes Point Machine

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Tworzy model klasyfikacji binarnej komputera punktu Bayesa

Kategoria: Machine Learning / Inicjowanie modelu / klasyfikacji

Uwaga

Dotyczy: Machine Learning Studio (wersja klasyczna)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób użycia modułu Two-Class Bayes Point Machine w programie Machine Learning Studio (wersja klasyczna) do utworzenia nieprzeszkolonego binarnego modelu klasyfikacji.

Algorytm w tym module wykorzystuje bayesyjską klasyfikację liniową o nazwie "Bayes Point Machine". Ten algorytm skutecznie przyblicza teoretycznie optymalną średnią bayesyjską klasyfikatorów liniowych (pod względem wydajności uogólnienia), wybierając jeden "średni" klasyfikator, punkt Bayesa. Ponieważ Bayes Point Machine jest modelem klasyfikacji Bayesa, nie jest podatny na zbytnie dopasowanie do danych treningowych.

Aby uzyskać więcej informacji, zobacz wpis Chrisa Airy'ego na blogu firmy Microsoft Machine Learning: Embracing Uncertainty - Probabilistic Inference (Embracing Niepewność — wnioskowanie probabilistyczne).

Jak skonfigurować maszynę Two-Class Bayesa

  1. W Machine Learning Studio (klasycznej) dodaj moduł Two-Class Bayes Point Machine (Dwuklasowa maszyna punktu bayesa) do eksperymentu. Moduł można znaleźć w obszarze Machine Learning, Initialize Model (Inicjowanie modelu) i Classification (Klasyfikacja).

  2. W przypadku liczby iteracji trenowania wpisz liczbę, aby określić, jak często algorytm przekazywania komunikatów iteruje po danych szkoleniowych. Zazwyczaj liczbę iteracji należy ustawić na wartość z zakresu 5–100.

    Im większa liczba iteracji trenowania, tym dokładniejsze są przewidywania. Jednak trenowania będą wolniejsze.

    W przypadku większości zestawów danych domyślne ustawienie 30 iteracji trenowania jest wystarczające, aby algorytm przewidywał dokładne dane. Czasami dokładne przewidywania mogą być dokonywane przy użyciu mniejszej liczby iteracji. W przypadku zestawów danych o wysoce skorelowanych funkcjach możesz skorzystać z większej liczby iteracji trenowania.

  3. Wybierz opcję Uwzględnij stronniczość, jeśli chcesz dodać stałą cechę lub odchylenie do każdego wystąpienia podczas trenowania i przewidywania.

    Jeśli dane nie zawierają jeszcze stałej funkcji, konieczne jest w tym przypadku stronniczość.

  4. Wybierz opcję Zezwalaj na nieznane wartości w cechach kategorii, aby utworzyć grupę dla nieznanych wartości.

    W przypadku zaznaczenia tej opcji model może akceptować tylko wartości zawarte w danych szkoleniowych.

    Jeśli wybierzesz tę opcję i zezwolisz na nieznane wartości, model może być mniej dokładny dla znanych wartości, ale może zapewnić lepsze przewidywania dla nowych (nieznanych) wartości.

  5. Dodaj wystąpienie modułu Train Model (Trenowanie modelu ) i dane szkoleniowe.

  6. Połączenie dane szkoleniowe i dane wyjściowe modułu Two-Class Bayes Point Machine (Dwuklasowa maszyna punktu bayesa) do modułu Train Model (Trenowanie modelu) i wybierz kolumnę label (etykieta).

  7. Uruchom eksperyment.

Wyniki

Po zakończeniu trenowania kliknij prawym przyciskiem myszy dane wyjściowe modułu Train Model (Trenowanie modelu ), aby wyświetlić wyniki:

  • Aby wyświetlić podsumowanie parametrów modelu wraz z wagami cech uczonymi podczas trenowania, wybierz pozycję Visualize (Wizualizacja).

  • Aby zapisać model do późniejszego użycia, kliknij prawym przyciskiem myszy dane wyjściowe funkcji Train MOdel (Trenowanie MOdel) i wybierz pozycję Save as Trained Model (Zapisz jako wytrenowany model).

  • Aby przewidywać, użyj wytrenowany model jako danych wejściowych modułu Score Model (Wytrenowanie modelu).

    Nieprzetrenowany model może być również przekazywany do modelu krzyżowej weryfikacji w celu krzyżowego sprawdzania poprawności zestawu danych z etykietami.

Przykłady

Aby zobaczyć, jak maszyna Two-Class Bayesa jest używana w uczeniu maszynowym, zobacz te przykładowe eksperymenty w Azure AI Gallery:

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji i często zadawane pytania dotyczące tego algorytmu.

Szczegółowe informacje z oryginalnych badań i teorii podstawowej są dostępne w tym dokumencie (PDF): Bayes Point Machines, a autorami są Herbert, Graepe i Campbell

Jednak ta implementacja ulepsza oryginalny algorytm na kilka sposobów:

Te ulepszenia sprawiają, że model klasyfikacji bayes point machine jest bardziej niezawodny i łatwiejszy w użyciu, a czasochłonny krok dostrajania parametrów można pominąć.

Parametry modułu

Nazwa Zakres Typ Domyślny Opis
Liczba iteracji trenowania >= 1 Liczba całkowita 30 Określanie liczby iteracji do użycia podczas trenowania
Uwzględnij stronniczość Dowolne Boolean Prawda Wskazanie, czy do każdego wystąpienia należy dodać stałą cechę lub odchylenie
Zezwalaj na nieznane wartości w cechach kategorii Dowolne Boolean Prawda W przypadku wartości True element tworzy dodatkowy poziom dla każdej kolumny kategorii. Wszystkie poziomy w testowym zestawie danych, które nie są dostępne w zestawie danych treningowych, są mapowane na ten dodatkowy poziom.

Dane wyjściowe

Nazwa Typ Opis
Nieprzetrenowany model ILearner, interfejs Nieprzetrenowany binarny model klasyfikacji

Zobacz też

Listamodułów ClassificationA-Z