model wyszukiwania Zawartości dla klastrowanie modele (Analysis Services — wyszukiwanie danych)
W tym temacie opisano wyszukiwania model zawartości, która jest specyficzna dla modeli korzystających z programu Microsoft klastrowanie algorytmu.Wyjaśnienie ogólnego model wyszukiwania zawartości dla wszystkich typów modelu zobacz Mining Model Content (Analysis Services - Data Mining).
Opis struktury modelu klastrowanie
Model klastrowania ma strukturę proste.Każdy model ma węzeł jednego nadrzędnego, który reprezentuje modelu i jego metadane, a każdy węzeł nadrzędny ma płaska lista klastrów (NODE_TYPE = 5).Z tej struktury jest wyświetlana w poniższym obrazie.
Każdy węzeł podrzędność reprezentuje jeden klaster i odpowiadające im szczegółowe informacje o atrybutach przypadki, w klastrze.Obejmuje to liczba liczbę przypadków, w klastrze i rozmieszczenie wartości, które odróżnić klastra od innych klastrów.
Uwaga
Nie ma potrzeby iterację wszystkich węzłów w celu uzyskania liczby lub Opis klastrów, węzeł nadrzędny modelu również zlicza i wyświetla listę klastrów.
Węzeł nadrzędny zawiera przydatne statystyki, opisujące rzeczywistej dystrybucji wszystkich spraw szkolenia.Statystyki te znajdują się kolumna tabela zagnieżdżonej NODE_DISTRIBUTION.Na przykład w poniższej tabela przedstawiono kilka wierszy z tabela NODE_DISTRIBUTION opisujących dystrybucji kryteria demograficzne odbiorcy dla klastrowanie modelu TM_Clustering, które są tworzone w Podstawowe wyszukiwanie danych — samouczek:
ATTRIBUTE_NAME |
ATRIBUTE_VALUE |
POMOC TECHNICZNA |
PRAWDOPODOBIEŃSTWO |
ODCHYLENIE |
VALUE_TYPE |
---|---|---|---|---|---|
Okres ważności |
Brak |
0 |
0 |
0 |
1 (Brak) |
Okres ważności |
44.9016152716593 |
12939 |
1 |
125.663453102554 |
3 (Ciągłe) |
Płeć |
Brak |
0 |
0 |
0 |
1 (Brak) |
Płeć |
P |
6350 |
0.490764355823479 |
0 |
4 (Dyskretnych) |
Płeć |
M |
6589 |
0.509235644176521 |
0 |
4 (Dyskretnych) |
Z tych wyniki można zobaczyć, czy wystąpiły 12939 przypadkach używane do budowania modelu, będący stosunek samców do samic o 50-50 i że średnia wieku został 44.Statystyka opisowa się różnić w zależności od tego, czy atrybut jest zgłaszane jest typu ciągłego dane liczbowe, takie jak wiek lub typ discrete wartości, takie jak płeć.Środki statystyczne Średnia and odchylenie są obliczane dla typów danych ciągły, podczas gdy prawdopodobieństwo and Pomoc techniczna są obliczane dla typów danych discrete.
Uwaga
Odchylenie reprezentuje całkowity wariancji dla klastra.Wartość odchylenia jest mała, wskazuje, że większość wartości kolumna były dość zbliżony do wartości średniej.Uzyskanie odchylenie standardowe należy obliczyć pierwiastek kwadratowy wariancji.
Zwróć uwagę, że dla każdego z atrybut jest Missing Typ wartości, które informuje o liczbie spraw wystąpił brak danych dla tego atrybut. Brakujące dane mogą być istotne i wpływa na obliczenia na różne sposoby, w zależności od typu danych.Aby uzyskać więcej informacji zobaczBrak wartości (Analysis Services — wyszukiwanie danych).
Model zawartości dla modelu klastrowanie
W tej części podano szczegółowe i przykłady tylko dla tych kolumn w modelu zawartości wyszukiwania, które odnoszą się do klastrowanie modeli.
Aby uzyskać informacje dotyczące ogólnego przeznaczenia kolumn w zestawie zestaw wierszy schematu, takie jak MODEL_CATALOG i MODEL_NAME zobacz Mining Model Content (Analysis Services - Data Mining).
MODEL_CATALOG
Nazwa bazy danych, w której przechowywane są w modelu.NAZWA_MODELU
Nazwa modelu.ATTRIBUTE_NAME
Zawsze puste w klastrowanie modeli, ponieważ jest w trybie nie dający się przewidzieć atrybut.NAZWA_WĘZŁA
Zawsze taka sama, jak NODE_UNIQUE_NAME.NODE_UNIQUE_NAME
Identyfikator unikatowy dla węzła w ramach modelu.Tej wartości nie można zmienić.NODE_TYPE
A klastrowanie modelu wyświetla następujące typy węzłów:Identyfikator węzła i nazwa
Description
1 (Model)
Węzeł główny dla modelu.
5 (Klastra)
Zawiera liczbę spraw w klastrze, charakterystyki przypadki, w klastrze i dane statystyczne, które opisują wartości w klastrze.
NODE_CAPTION
Przyjazna nazwa w celach wyświetlania.Podczas tworzenia modelu wartość NODE_UNIQUE_NAME jest automatycznie używana jako podpisu.Można jednak zmienić wartość NODE_CAPTION zaktualizować nazwy wyświetlanej dla klastra, programowo lub przy użyciu przeglądarki.Uwaga
Gdy użytkownik ponownie przetworzyć modelu, wszystkie zmiany nazwy zostaną zastąpione przez nowe wartości.Nie można utrwalić nazwy w modelu, ani śledzić zmiany w członkostwie klastra między różnymi wersjami modelu.
CHILDREN_CARDINALITY
Oszacowanie liczby dzieci, który węzeł ma.Węzeł nadrzędny Wskazuje liczbę klastrów w modelu.
Węzły klastra Zawsze 0.
PARENT_UNIQUE_NAME
Unikatowa nazwa węzła nadrzędnego.Węzeł nadrzędny Zawsze mieć wartości NULL
Węzły klastra Zazwyczaj 000.
NODE_DESCRIPTION
Opis węzła.Węzeł nadrzędny Zawsze (Wszystkie).
Węzły klastra Rozdzielana przecinkami lista podstawowa atrybutów, które odróżnić klastra od innych klastrów.
NODE_RULE
Nie używany dla klastrowanie modeli.MARGINAL_RULE
Nie używany dla klastrowanie modeli.NODE_PROBABILITY
Prawdopodobieństwo związane z tym węźle.Węzeł nadrzędny Zawsze 1.Węzły klastra Prawdopodobieństwo reprezentuje prawdopodobieństwo złożonych atrybutów z niektóre dostosowania, w zależności od algorytmu używanego do tworzenia klastrowanie modelu.
MARGINAL_PROBABILITY
Prawdopodobieństwo osiągnięcia węzła z węzła nadrzędnego.W klastrowanie model marginalna prawdopodobieństwa jest zawsze taka sama, jak prawdopodobieństwo węzła.NODE_DISTRIBUTION
Tabela zawierająca histogramu prawdopodobieństwo węzła.Węzeł nadrzędny Zobacz Introduction to w tym temacie.
Węzły klastra Reprezentuje dystrybucji atrybutów i wartości w przypadkach, które znajdują się w tym klastrze.
NODE_SUPPORT
Liczba przypadków, które obsługują ten węzeł.Węzeł nadrzędny Wskazuje liczbę przypadków szkoleń dla całego modelu.Węzły klastra Wskazuje rozmiar klastra, jak liczba przypadków.
Uwaga Jeśli model korzysta średniej K, klastrowanie, każdorazowo może należeć do klastra tylko jeden.Jednak jeśli model korzysta z klastrowanie EM, każdorazowo może należeć do różnych klastrów i przypadek jest przypisywana odległości ważona dla każdego klastra, do której on należy.W związku z tym w przypadku modeli EM sumę obsługę do pojedynczego klastra jest większa niż obsługę model ogólny.
MSOLAP_MODEL_COLUMN
Nie używany dla klastrowanie modeli.MSOLAP_NODE_SCORE
Wyświetla wynik skojarzony z węzłem.Węzeł nadrzędny Wynik Bayesian kryterium Information (BIC) dla klastrowanie modelu.
Węzły klastra Zawsze 0.
MSOLAP_NODE_SHORT_CAPTION
Etykiety używane w celach wyświetlania.Nie można zmienić tego podpisu.Węzeł nadrzędny Typ modelu: Cluster modelu
Węzły klastra Nazwa klastra.Przykład: Klaster 1.
Remarks
Analysis Services udostępnia kilka metod tworzenia klastrowanie modelu.Jeśli nie wiesz, jakiej metoda został użyty do utworzenia modelu, który użytkownik pracuje z, można pobrać metadane modelu programistycznie, za pomocą klient programu ADOMD lub AMO lub za pomocą kwerend wysyłanych do zestaw zestaw wierszy schematu wyszukiwanie danych.Aby uzyskać więcej informacji zobaczJak Parametry używane do tworzenia modeli wyszukiwania kwerendy.
Uwaga
Struktura i zawartość modelu pozostają takie same, niezależnie od których klastrowania metoda i parametrów można używać.