Two-Class Bayes Point Machine
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
Tworzy model klasyfikacji binarnej komputera punktu Bayesa
Kategoria: Machine Learning / Inicjowanie modelu / klasyfikacji
Uwaga
Dotyczy: Machine Learning Studio (wersja klasyczna)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Omówienie modułu
W tym artykule opisano sposób użycia modułu Two-Class Bayes Point Machine w programie Machine Learning Studio (wersja klasyczna) do utworzenia nieprzeszkolonego binarnego modelu klasyfikacji.
Algorytm w tym module wykorzystuje bayesyjską klasyfikację liniową o nazwie "Bayes Point Machine". Ten algorytm skutecznie przyblicza teoretycznie optymalną średnią bayesyjską klasyfikatorów liniowych (pod względem wydajności uogólnienia), wybierając jeden "średni" klasyfikator, punkt Bayesa. Ponieważ Bayes Point Machine jest modelem klasyfikacji Bayesa, nie jest podatny na zbytnie dopasowanie do danych treningowych.
Aby uzyskać więcej informacji, zobacz wpis Chrisa Airy'ego na blogu firmy Microsoft Machine Learning: Embracing Uncertainty - Probabilistic Inference (Embracing Niepewność — wnioskowanie probabilistyczne).
Jak skonfigurować maszynę Two-Class Bayesa
W Machine Learning Studio (klasycznej) dodaj moduł Two-Class Bayes Point Machine (Dwuklasowa maszyna punktu bayesa) do eksperymentu. Moduł można znaleźć w obszarze Machine Learning, Initialize Model (Inicjowanie modelu) i Classification (Klasyfikacja).
W przypadku liczby iteracji trenowania wpisz liczbę, aby określić, jak często algorytm przekazywania komunikatów iteruje po danych szkoleniowych. Zazwyczaj liczbę iteracji należy ustawić na wartość z zakresu 5–100.
Im większa liczba iteracji trenowania, tym dokładniejsze są przewidywania. Jednak trenowania będą wolniejsze.
W przypadku większości zestawów danych domyślne ustawienie 30 iteracji trenowania jest wystarczające, aby algorytm przewidywał dokładne dane. Czasami dokładne przewidywania mogą być dokonywane przy użyciu mniejszej liczby iteracji. W przypadku zestawów danych o wysoce skorelowanych funkcjach możesz skorzystać z większej liczby iteracji trenowania.
Wybierz opcję Uwzględnij stronniczość, jeśli chcesz dodać stałą cechę lub odchylenie do każdego wystąpienia podczas trenowania i przewidywania.
Jeśli dane nie zawierają jeszcze stałej funkcji, konieczne jest w tym przypadku stronniczość.
Wybierz opcję Zezwalaj na nieznane wartości w cechach kategorii, aby utworzyć grupę dla nieznanych wartości.
W przypadku zaznaczenia tej opcji model może akceptować tylko wartości zawarte w danych szkoleniowych.
Jeśli wybierzesz tę opcję i zezwolisz na nieznane wartości, model może być mniej dokładny dla znanych wartości, ale może zapewnić lepsze przewidywania dla nowych (nieznanych) wartości.
Dodaj wystąpienie modułu Train Model (Trenowanie modelu ) i dane szkoleniowe.
Połączenie dane szkoleniowe i dane wyjściowe modułu Two-Class Bayes Point Machine (Dwuklasowa maszyna punktu bayesa) do modułu Train Model (Trenowanie modelu) i wybierz kolumnę label (etykieta).
Uruchom eksperyment.
Wyniki
Po zakończeniu trenowania kliknij prawym przyciskiem myszy dane wyjściowe modułu Train Model (Trenowanie modelu ), aby wyświetlić wyniki:
Aby wyświetlić podsumowanie parametrów modelu wraz z wagami cech uczonymi podczas trenowania, wybierz pozycję Visualize (Wizualizacja).
Aby zapisać model do późniejszego użycia, kliknij prawym przyciskiem myszy dane wyjściowe funkcji Train MOdel (Trenowanie MOdel) i wybierz pozycję Save as Trained Model (Zapisz jako wytrenowany model).
Aby przewidywać, użyj wytrenowany model jako danych wejściowych modułu Score Model (Wytrenowanie modelu).
Nieprzetrenowany model może być również przekazywany do modelu krzyżowej weryfikacji w celu krzyżowego sprawdzania poprawności zestawu danych z etykietami.
Przykłady
Aby zobaczyć, jak maszyna Two-Class Bayesa jest używana w uczeniu maszynowym, zobacz te przykładowe eksperymenty w Azure AI Gallery:
- Porównaj klasyfikatory binarne: w tym przykładzie pokazano użycie wielu klasyfikatorów dwuklasowych.
Uwagi techniczne
Ta sekcja zawiera szczegóły implementacji i często zadawane pytania dotyczące tego algorytmu.
Szczegółowe informacje z oryginalnych badań i teorii podstawowej są dostępne w tym dokumencie (PDF): Bayes Point Machines, a autorami są Herbert, Graepe i Campbell
Jednak ta implementacja ulepsza oryginalny algorytm na kilka sposobów:
Używa algorytmu przekazywania komunikatów propagacji oczekiwania. Aby uzyskać więcej informacji, zobacz A family of algorithms for approximate Bayesian inference (Rodzina algorytmów dla przybliżonego wnioskowania Bayesa).
Czyszczenie parametrów nie jest wymagane.
Ta metoda nie wymaga normalizacji danych.
Te ulepszenia sprawiają, że model klasyfikacji bayes point machine jest bardziej niezawodny i łatwiejszy w użyciu, a czasochłonny krok dostrajania parametrów można pominąć.
Parametry modułu
Nazwa | Zakres | Typ | Domyślny | Opis |
---|---|---|---|---|
Liczba iteracji trenowania | >= 1 | Liczba całkowita | 30 | Określanie liczby iteracji do użycia podczas trenowania |
Uwzględnij stronniczość | Dowolne | Boolean | Prawda | Wskazanie, czy do każdego wystąpienia należy dodać stałą cechę lub odchylenie |
Zezwalaj na nieznane wartości w cechach kategorii | Dowolne | Boolean | Prawda | W przypadku wartości True element tworzy dodatkowy poziom dla każdej kolumny kategorii. Wszystkie poziomy w testowym zestawie danych, które nie są dostępne w zestawie danych treningowych, są mapowane na ten dodatkowy poziom. |
Dane wyjściowe
Nazwa | Typ | Opis |
---|---|---|
Nieprzetrenowany model | ILearner, interfejs | Nieprzetrenowany binarny model klasyfikacji |