Udostępnij za pośrednictwem


Poznawanie modelu klastrowanie (samouczek podstawowego wyszukiwanie danych)

The Microsoft klastrowanie algorithm groups cases into clusters that contain similar characteristics. Te grupy są przydatne do eksplorowania danych, identyfikujący anomalii w danych i tworzenia prognoz.

The Microsoft Cluster Viewer provides the following tabs for use in exploring klastrowanie mining models:

Diagram klastra

Profile klastra

Właściwości klastra

Dyskryminacji klastra

W poniższych sekcjach opisano sposób zaznacz odpowiednią przeglądarkę i Poznaj inne modele wyszukiwania.

Karta diagram klastra

Na karcie diagram klastra są wyświetlane wszystkie klastry, które są w model wyszukiwania.Linie między klastrów reprezentują "bliskość" i są wyszarzone w zależności od tego, w jaki sposób podobne klastrów są.Rzeczywiste kolor każdego klastra reprezentuje częstotliwość zmiennej i stanu klastra.

Aby poznać modelu na karcie diagram klastrów

  1. Użycie Model górnictwie listy u góry Podgląd górnictwie modelu kartę, aby przełączyć się do TM_Clustering modelu.

  2. W Podgląd Wybierz opcję listyPodgląd klastrowania firmy Microsoft.

  3. W Zmienna cieniowanie Wybierz opcję poluRower kupujących.

    Zmienna domyślnym jest zapełnianie, ale można to zmienić na dowolny atrybut w modelu, aby wykryć klastry, które zawierają elementy członkowskie, których atrybuty, które mają.

  4. Wybierz opcję 1 in the Stan pole, aby poznać tych przypadkach, gdzie został nabyty rowerów.

    The Density legend describes the density of the atrybut state pair selected in the Shading Variable and the State.In this example it tells us that the clusterwith the darkest shading has the highest percentage of bike buyers.

  5. Umieść wskaźnik myszy nad klastra z cieniowaniem najciemniejszy.

    Etykietka narzędzia zawiera procent sprawy, które mają ten atrybut Bike Buyer = 1.

  6. Wybierz klaster, który ma najwyższy gęstość, kliknij prawym przyciskiem myszy klaster, wybierz opcję Zmienianie nazwy klastra and type Bike kupujących wysoki do identyfikacji później.Click OK.

  7. Znajdź klaster, który ma najjaśniejsze cieniowanie (i najniższy gęstość).Kliknij prawym przyciskiem myszy klaster, wybierz opcję Zmienianie nazwy klastra and type Rower kupujących niski.Click OK.

  8. Kliknij przycisk Bike kupujących wysoki klastra i przeciągnij go do obszaru, w okienku, które można wyświetlić ze swoich połączeń do innych klastrów wyraźnego.

    Po wybraniu klastra, wiersze, które połączyć się z tym klastrem innych klastrów są wyróżnione, dzięki czemu można łatwo wyświetlić wszystkie relacje dla tego klastra.Jeśli klastra nie jest zaznaczone, można stwierdzić przez ciemności wierszy jak silne są relacje między wszystkich klastrów na diagramie.Jeśli cieniowanie jest jasne lub nieistniejącej, klastry nie są bardzo podobne.

  9. Za pomocą suwaka po lewej stronie do sieci, odfiltrować słabsze łącza i znaleźć klastrów najbliższy relacjami.The Adventure Works Cycles marketing department might want to combine similar clusters together when determining the best metoda for delivering the targeted mailing.

Powrót do początku

Karta Profile klastra

The Cluster Profiles tab provides an overall view of the TM_Clustering model.The Cluster Profiles tab contains a kolumna for each cluster in the model.Pierwsza kolumna zawiera listę atrybutów, które są skojarzone z co najmniej jeden klaster.Pozostałe przeglądarki zawiera dystrybucji stanów atrybut dla każdego klastra.Rozkład zmiennej dyskretnych jest wyświetlany jako kolorowego słupka z maksymalną liczbę słupków, wyświetlane w Paski histogramu listy.Atrybuty stałe są wyświetlane z wykresem romb, co stanowi średnią i odchylenie standardowe w każdym klastrze.

Aby poznać modelu w karcie Profile klastrów

  1. Zestaw Histogram bars to 5.

    W naszym modelu 5 jest maksymalna liczba stanów dla dowolnej zmiennej jeden.

  2. Jeśli Legenda wyszukiwania blokuje wyświetlanie Atrybut profilów, przenieś je z drogi.

  3. Wybierz Bike kupujących wysoki kolumna i przeciągnij go na prawo od zapełnianie kolumna.

  4. Wybierz Rower kupujących niski kolumna i przeciągnij go na prawo od Bike kupujących wysoki kolumna.

  5. Kliknij przycisk Bike kupujących wysoki kolumna.

    The Variables kolumna is sorted in order of importance for that cluster.Przewiń kolumna i Przejrzyj właściwości klastra, duży nabywca Bike.Na przykład są one bardziej prawdopodobne, że mają krótki commute.

  6. Kliknij dwukrotnie Okres ważności komórkaBike kupujących wysoki kolumna.

    The Mining Legend displays a more detailed view and you can see the age zakres of these customers as well as the mean age.

  7. Kliknij prawym przyciskiem myszy Rower kupujących niski kolumna i wybierz opcję Ukryj kolumna.

Powrót do początku

Karta właściwości klastra

Z Właściwości klastra karcie, można sprawdzić bardziej szczegółowo właściwości wchodzące w skład klastra.Zamiast porównywania cech, wszystkich klastrów (tak jak w karcie Profile klastra), można przeglądać jednego klastra w danej chwili.Na przykład, jeśli wybrano opcję Bike kupujących wysoki from the Klaster listy, można wyświetlić właściwości klientów w tym klastrze.Chociaż wyświetlania różni się od przeglądarki profile klastrów, wyniki są takie same.

Uwaga

Chyba że użytkownik zestaw wartość początkową holdoutseed, wyniki zmieniają się za każdym razem, są przetwarzane w modelu.Aby uzyskać więcej informacji, zobacz Element HoldoutSeed

Powrót do początku

Karta dyskryminacji klastra

Z Dyskryminacji klastra Karta można przeglądać właściwości, które odróżniają jednego klastra z innego. Po wybraniu dwa klastry, z Klaster 1 listy, a jeden z Klaster 2 listy, w podglądzie oblicza różnice między klastrów i wyświetla listę atrybutów, które najbardziej odróżniają klastrów.

Aby poznać modelu na karcie dyskryminacji klastrów

  1. W Klaster 1 Wybierz opcję poluBike kupujących wysoki.

  2. W Klaster 2 Wybierz opcję poluRower kupujących niski.

  3. Kliknij przycisk Zmienne , aby posortować w kolejności alfabetycznej.

    Niektóre bardziej znaczące różnice między klientami w Rower kupujących niski and Bike kupujących wysoki klastrów obejmują wieku, własność samochód, liczba dzieci i region.