Udostępnij za pośrednictwem


Algorytm Bayes Naive firmy Microsoft

The Microsoft Naive Bayes algorithm is a classification algorithm provided by Microsoft SQL Server Analysis Services for use in predictive modeling.Nazwa Naive Bayes wynika z fakt, że algorytm theorem Bayes są używane, ale nie uwzględniać zależności konta, które mogą istnieć, a zatem jego założenia są określane jako naive.

Ten algorytm jest mniej praktyce intensywna niż inne Microsoft algorytmy i dlatego jest przydatna do szybkiego generowania modeli wyszukiwania wykrywanie relacje między kolumnami danych wejściowych i przewidywalny kolumn. Za pomocą tego algorytmu można wstępne explorations danych, a następnie później można stosować do tworzenia modeli dodatkowe wyszukiwania z innych algorytmów, które są bardziej praktyce intensywnej i dokładniejsze wyniki.

Przykład

Jako stałe strategii promocyjne dział marketingu firmy Adventure Works Cycle zdecydowała się do potencjalnych klientów przez korespondencji poza fliers.Aby zmniejszyć koszty, chcą wysyłać fliers tylko do klientów, którzy mogą odpowiadać.Firma informacje są przechowywane w bazie danych o kryteria demograficzne oraz odpowiedzi na poprzednie korespondencji.Których chcą używać tych danych, aby zobaczyć, jak kryteria demograficzne, takie jak wiek, a lokalizacja może pomóc przewidzieć odpowiedzi promocji, porównując potencjalnych klientów do klientów, którzy mają podobne cechy i którzy kupili z firmy w przeszłości.W szczególności chcą Zobacz różnice między zakupami roweru klientów i klientów, którzy nie określa tego.

Za pomocą Microsoft Algorytm Bayes naive, dział marketingu może szybko przewidywania wyniku profilu określonego nabywcy, a w związku z tym można określić, którzy są najbardziej prawdopodobne odpowiedzieć na fliers. Za pomocą Microsoft Naive Podgląd Bayes w Business Intelligence Development Studio, mogą one również wizualnie zbadać specjalnie kolumny danych wejściowych, które przyczyniają się do pozytywnych odpowiedzi na fliers.

Jak działa algorytmu

The Microsoft Naive Bayes algorithm calculates the probability of every state of each input column, given each possible state of the przewidywalna kolumna. Można użyć Microsoft Naive Podgląd Bayes w Business Intelligence Development Studio Aby zobaczyć wizualną reprezentację jak algorytm rozsyła stanów, jak pokazano na poniższym rysunku.

Naive bayes distribution of states

The Microsoft Naive Bayes Viewer lists each input column in the dataset, and shows how the states of each column are distributed, given each state of the przewidywalna kolumna. Ten widok służy do identyfikowania wejściowy kolumny, które są istotne w przypadku rozróżnianie między Stanami przewidywalna kolumna.Na przykład kolumna Commute odległość wyświetlane w tym przypadku klient commutes od jednej do dwóch mil do pracy, prawdopodobieństwo, że klient będzie kupić rowerów jest 0.387 i prawdopodobieństwo, że odbiorcy nie kupują rowerów jest 0.287.W tym przykładzie algorytm używa danych liczbowych, pochodzące od klientów cechy, takie jak odległość commute do przewidywania, czy klient będzie kupić rowerów.Aby uzyskać więcej informacji o korzystaniu z Microsoft Podgląd Bayes naive, zobacz Wyświetlanie model wyszukiwania z podglądem Bayes Naive firmy Microsoft.

Dane wymagane dla Naive Bayes modele

Podczas przygotowywania danych do użycia w modelu Naive Bayes szkolenia, należy zapoznać się wymagania dotyczące algorytm, jaki dane są potrzebne i sposobu używania danych.

Wymagania dotyczące modelu Naive Bayes są następujące:

  • Pojedyncza kolumna klucz   Każdy model musi zawierać jedną kolumnę numerycznym lub tekstowym, które jednoznacznie identyfikują każdy rekord.Złożone klucze nie są dozwolone.

  • Kolumny danych wejściowych   W modelu Naive Bayes, wszystkie kolumny muszą być discrete albo discretized kolumn.Aby uzyskać informacje na temat discretizing kolumn zobacz Metody discretization (wyszukiwanie danych). W przypadku modelu Naive Bayes jest ważne, aby zapewnić, że wejściowe atrybuty są niezależne od siebie.

  • Co najmniej jedną przewidywalna kolumna    Atrybut przewidywalne muszą zawierać wartości discrete lub discretized.Wartości kolumna przewidywalne mogą być traktowane jako dane wejściowe i są często, aby znaleźć relacji między kolumnami.

Wyświetlanie modelu

Aby poznać modelu, można użyć Podgląd Bayes Naive firmy Microsoft.Przeglądarka pokazuje wejściowy atrybuty dotyczą przewidywalne atrybut.Przeglądarka zapewnia także szczegółowe profilu dla każdego klastra listy atrybutów, które każdy klaster od siebie odróżnić i charakterystyki szkolenia całego zestaw danych.Aby uzyskać więcej informacji zobaczWyświetlanie model wyszukiwania z podglądem Bayes Naive firmy Microsoft.

Jeśli chcesz wiedzieć więcej szczegółów można przeglądać w modelu Microsoft Generic Content Tree Viewer (Data Mining Designer). Aby uzyskać więcej informacji na temat rodzaju informacji przechowywanych w modelu zobacz model wyszukiwania Zawartości dla Naive modele Bayes (Analysis Services — wyszukiwanie danych).

Tworzenie prognoz

Model ma został wyszkolony, wyniki są przechowywane jako zbiór wzorce, które można eksplorować lub użyć do utworzenia prognoz.

Można utworzyć kwerendy w celu zwrócenia prognoz, w jaki sposób nowe dane informacje odnoszą się do atrybut przewidywalne lub możesz pobrać statystyk, które opisują korelacji, znaleziony przez model.

Aby uzyskać informacje dotyczące tworzenia kwerend względem model wyszukiwanie danych zobacz Podczas badania modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych). Aby zapoznać się z przykładami modelu Naive Bayes należy użyć kwerendy Zobacz Podczas badania Naive modelu Bayes (Analysis Services — wyszukiwanie danych).

Uwagi

  • Obsługuje korzystanie z przewidywanego modelu Markup Language (PMML) do tworzenia modeli wyszukiwania.

  • Obsługuje przeglądanie szczegółowe.

  • Nie obsługuje tworzenia wymiary wyszukiwanie danych.

  • Obsługuje korzystanie z modeli wyszukiwania OLAP.