Udostępnij za pośrednictwem


model wyszukiwania Zawartości dla klastrowanie modele (Analysis Services — wyszukiwanie danych)

W tym temacie opisano wyszukiwania model zawartości, która jest specyficzna dla modeli korzystających z programu Microsoft klastrowanie algorytmu.Wyjaśnienie ogólnego model wyszukiwania zawartości dla wszystkich typów modelu zobacz Mining Model Content (Analysis Services - Data Mining).

Opis struktury modelu klastrowanie

Model klastrowania ma strukturę proste.Każdy model ma węzeł jednego nadrzędnego, który reprezentuje modelu i jego metadane, a każdy węzeł nadrzędny ma płaska lista klastrów (NODE_TYPE = 5).Z tej struktury jest wyświetlana w poniższym obrazie.

structure of model content for clustering

Każdy węzeł podrzędność reprezentuje jeden klaster i odpowiadające im szczegółowe informacje o atrybutach przypadki, w klastrze.Obejmuje to liczba liczbę przypadków, w klastrze i rozmieszczenie wartości, które odróżnić klastra od innych klastrów.

Uwaga

Nie ma potrzeby iterację wszystkich węzłów w celu uzyskania liczby lub Opis klastrów, węzeł nadrzędny modelu również zlicza i wyświetla listę klastrów.

Węzeł nadrzędny zawiera przydatne statystyki, opisujące rzeczywistej dystrybucji wszystkich spraw szkolenia.Statystyki te znajdują się kolumna tabela zagnieżdżonej NODE_DISTRIBUTION.Na przykład w poniższej tabela przedstawiono kilka wierszy z tabela NODE_DISTRIBUTION opisujących dystrybucji kryteria demograficzne odbiorcy dla klastrowanie modelu TM_Clustering, które są tworzone w Podstawowe wyszukiwanie danych — samouczek:

ATTRIBUTE_NAME

ATRIBUTE_VALUE

POMOC TECHNICZNA

PRAWDOPODOBIEŃSTWO

ODCHYLENIE

VALUE_TYPE

Okres ważności

Brak

0

0

0

1 (Brak)

Okres ważności

44.9016152716593

12939

1

125.663453102554

3 (Ciągłe)

Płeć

Brak

0

0

0

1 (Brak)

Płeć

P

6350

0.490764355823479

0

4 (Dyskretnych)

Płeć

M

6589

0.509235644176521

0

4 (Dyskretnych)

Z tych wyniki można zobaczyć, czy wystąpiły 12939 przypadkach używane do budowania modelu, będący stosunek samców do samic o 50-50 i że średnia wieku został 44.Statystyka opisowa się różnić w zależności od tego, czy atrybut jest zgłaszane jest typu ciągłego dane liczbowe, takie jak wiek lub typ discrete wartości, takie jak płeć.Środki statystyczne Średnia and odchylenie są obliczane dla typów danych ciągły, podczas gdy prawdopodobieństwo and Pomoc techniczna są obliczane dla typów danych discrete.

Uwaga

Odchylenie reprezentuje całkowity wariancji dla klastra.Wartość odchylenia jest mała, wskazuje, że większość wartości kolumna były dość zbliżony do wartości średniej.Uzyskanie odchylenie standardowe należy obliczyć pierwiastek kwadratowy wariancji.

Zwróć uwagę, że dla każdego z atrybut jest Missing Typ wartości, które informuje o liczbie spraw wystąpił brak danych dla tego atrybut. Brakujące dane mogą być istotne i wpływa na obliczenia na różne sposoby, w zależności od typu danych.Aby uzyskać więcej informacji zobaczBrak wartości (Analysis Services — wyszukiwanie danych).

Model zawartości dla modelu klastrowanie

W tej części podano szczegółowe i przykłady tylko dla tych kolumn w modelu zawartości wyszukiwania, które odnoszą się do klastrowanie modeli.

Aby uzyskać informacje dotyczące ogólnego przeznaczenia kolumn w zestawie zestaw wierszy schematu, takie jak MODEL_CATALOG i MODEL_NAME zobacz Mining Model Content (Analysis Services - Data Mining).

  • MODEL_CATALOG
    Nazwa bazy danych, w której przechowywane są w modelu.

  • NAZWA_MODELU
    Nazwa modelu.

  • ATTRIBUTE_NAME
    Zawsze puste w klastrowanie modeli, ponieważ jest w trybie nie dający się przewidzieć atrybut.

  • NAZWA_WĘZŁA
    Zawsze taka sama, jak NODE_UNIQUE_NAME.

  • NODE_UNIQUE_NAME
    Identyfikator unikatowy dla węzła w ramach modelu.Tej wartości nie można zmienić.

  • NODE_TYPE
    A klastrowanie modelu wyświetla następujące typy węzłów:

    Identyfikator węzła i nazwa

    Description

    1 (Model)

    Węzeł główny dla modelu.

    5 (Klastra)

    Zawiera liczbę spraw w klastrze, charakterystyki przypadki, w klastrze i dane statystyczne, które opisują wartości w klastrze.

  • NODE_CAPTION
    Przyjazna nazwa w celach wyświetlania.Podczas tworzenia modelu wartość NODE_UNIQUE_NAME jest automatycznie używana jako podpisu.Można jednak zmienić wartość NODE_CAPTION zaktualizować nazwy wyświetlanej dla klastra, programowo lub przy użyciu przeglądarki.

    Uwaga

    Gdy użytkownik ponownie przetworzyć modelu, wszystkie zmiany nazwy zostaną zastąpione przez nowe wartości.Nie można utrwalić nazwy w modelu, ani śledzić zmiany w członkostwie klastra między różnymi wersjami modelu.

  • CHILDREN_CARDINALITY
    Oszacowanie liczby dzieci, który węzeł ma.

    Węzeł nadrzędny   Wskazuje liczbę klastrów w modelu.

    Węzły klastra   Zawsze 0.

  • PARENT_UNIQUE_NAME
    Unikatowa nazwa węzła nadrzędnego.

    Węzeł nadrzędny    Zawsze mieć wartości NULL

    Węzły klastra   Zazwyczaj 000.

  • NODE_DESCRIPTION
    Opis węzła.

    Węzeł nadrzędny   Zawsze (Wszystkie).

    Węzły klastra   Rozdzielana przecinkami lista podstawowa atrybutów, które odróżnić klastra od innych klastrów.

  • NODE_RULE
    Nie używany dla klastrowanie modeli.

  • MARGINAL_RULE
    Nie używany dla klastrowanie modeli.

  • NODE_PROBABILITY
    Prawdopodobieństwo związane z tym węźle.Węzeł nadrzędny   Zawsze 1.

    Węzły klastra   Prawdopodobieństwo reprezentuje prawdopodobieństwo złożonych atrybutów z niektóre dostosowania, w zależności od algorytmu używanego do tworzenia klastrowanie modelu.

  • MARGINAL_PROBABILITY
    Prawdopodobieństwo osiągnięcia węzła z węzła nadrzędnego.W klastrowanie model marginalna prawdopodobieństwa jest zawsze taka sama, jak prawdopodobieństwo węzła.

  • NODE_DISTRIBUTION
    Tabela zawierająca histogramu prawdopodobieństwo węzła.

    Węzeł nadrzędny   Zobacz Introduction to w tym temacie.

    Węzły klastra   Reprezentuje dystrybucji atrybutów i wartości w przypadkach, które znajdują się w tym klastrze.

  • NODE_SUPPORT
    Liczba przypadków, które obsługują ten węzeł.Węzeł nadrzędny   Wskazuje liczbę przypadków szkoleń dla całego modelu.

    Węzły klastra   Wskazuje rozmiar klastra, jak liczba przypadków.

    Uwaga   Jeśli model korzysta średniej K, klastrowanie, każdorazowo może należeć do klastra tylko jeden.Jednak jeśli model korzysta z klastrowanie EM, każdorazowo może należeć do różnych klastrów i przypadek jest przypisywana odległości ważona dla każdego klastra, do której on należy.W związku z tym w przypadku modeli EM sumę obsługę do pojedynczego klastra jest większa niż obsługę model ogólny.

  • MSOLAP_MODEL_COLUMN
    Nie używany dla klastrowanie modeli.

  • MSOLAP_NODE_SCORE
    Wyświetla wynik skojarzony z węzłem.

    Węzeł nadrzędny   Wynik Bayesian kryterium Information (BIC) dla klastrowanie modelu.

    Węzły klastra   Zawsze 0.

  • MSOLAP_NODE_SHORT_CAPTION
    Etykiety używane w celach wyświetlania.Nie można zmienić tego podpisu.

    Węzeł nadrzędny   Typ modelu: Cluster modelu

    Węzły klastra   Nazwa klastra.Przykład: Klaster 1.

Remarks

Analysis Services udostępnia kilka metod tworzenia klastrowanie modelu.Jeśli nie wiesz, jakiej metoda został użyty do utworzenia modelu, który użytkownik pracuje z, można pobrać metadane modelu programistycznie, za pomocą klient programu ADOMD lub AMO lub za pomocą kwerend wysyłanych do zestaw zestaw wierszy schematu wyszukiwanie danych.Aby uzyskać więcej informacji zobaczJak Parametry używane do tworzenia modeli wyszukiwania kwerendy.

Uwaga

Struktura i zawartość modelu pozostają takie same, niezależnie od których klastrowania metoda i parametrów można używać.