Mining Model Content (Analysis Services - Data Mining)
Po zostały zaprojektowane i przetwarzania model wyszukiwania przy użyciu danych z podstawową struktura wyszukiwania model wyszukiwania została zakończona i zawiera Zawartość modeli wyszukiwania.Zawartość ta umożliwia tworzenie prognoz i analizowania danych.
model wyszukiwania zawartości zawiera metadane dotyczące modelu, statystyki dotyczące danych i wzorców wykrytych przez algorytm wyszukiwania.W zależności od algorytmu, który został użyty zawartość modelu może zawierać formuły regresja, definicje reguł i itemsets lub wag i inne dane statystyczne.
Niezależnie od algorytmu, który został użyty model wyszukiwania zawartości są prezentowane w postaci standardowych.Można przeglądać strukturę w rodzajowy zawartości drzewa Podgląd firmy Microsoft, pod warunkiem że w Business Intelligence Development Studio, a następnie przełącz się do jednego z niestandardowych przeglądarki, aby zobaczyć, jak informacje są interpretowane i wyświetlane w postaci graficznej dla każdego typu modelu. Można również utworzyć kwerendy przed model wyszukiwania zawartości za pomocą dowolnego klient, który obsługuje MINING_MODEL_CONTENT zestaw wierszy schematu.Aby uzyskać więcej informacji zobaczPodczas badania modeli wyszukiwanie danych: Jak to zrobić tematy (Analysis Services — wyszukiwanie danych).
W tej części opisano strukturę podstawową zawartość dla wszystkich rodzajów modeli wyszukiwania.Zamieszczono w nim również informacje na temat typów węzłów, które są wspólne dla wszystkich model wyszukiwania zawartości i zawiera wskazówki dotyczące interpretacji danych.
Struktura model wyszukiwania zawartości
Węzły
Zawartość model wyszukiwania przez typ algorytmu
Narzędzia do przeglądania zawartości model wyszukiwania
Narzędzia do Kwerenda model wyszukiwania zawartości
Struktura model wyszukiwania zawartości
Zawartość każdego modelu jest przedstawiany jako serii węzły.Węzeł jest obiektem w model wyszukiwania, który zawiera metadane i informacje o części modelu.Węzły są ułożone w hierarchii.Dokładne rozmieszczenie węzłów w hierarchii i rozumieniu hierarchii, zależy od algorytmu, który zostanie użyty.Na przykład jeśli tworzysz model do drzewa decyzji, model może zawierać wiele drzew, wszystkie podłączone do modelu głównego, jeśli tworzysz model sieci neuronowe modelu może zawierać jeden lub więcej sieci oraz węzeł Statystyka.
Nazywa się pierwszym węzłem w każdym modelu węzeł główny, or the Model obiektu nadrzędnego. węzła.Każdy model ma węzła głównego (NODE_TYPE = 1).Węzeł główny zazwyczaj zawiera niektóre metadane dotyczące modelu oraz liczby węzłów podrzędność, ale nieco dodatkowe informacje dotyczące wzorców wykryte przez model.
W zależności od tego, który algorytm używany do tworzenia modelu węzła głównego ma różną liczbę węzłów podrzędność.Węzły podrzędność mają inne znaczenie i zawierać inną zawartość w zależności od algorytmu głębokość i złożoności danych.
Powrót do początku
Węzły
W modelu górnictwo węzeł jest kontener ogólnego przeznaczenia, który przechowuje informacji o wszystkich lub części modelu.Struktura każdy węzeł jest zawsze taka sama, a zawiera w kolumnach wyznaczonych przez zestaw wierszy schematu wyszukiwanie danych.Aby uzyskać więcej informacji zobaczZestaw wierszy DMSCHEMA_MINING_MODEL_CONTENT.
Każdy węzeł zawiera metadane dotyczące węzła, w tym identyfikator, który jest unikatowy w obrębie każdego modelu, identyfikator węzła nadrzędnego, a także liczby węzłów podrzędność, który węzeł ma.Metadane identyfikuje modelu, do której należy dany węzeł i przechowywania określonego modelu wykaz bazy danych.Dodatkowa zawartość w węźle różni się w zależności od typu algorytm używany do tworzenia modelu i mogą być następujące:
Liczba przypadków danych szkoleniowych, które obsługuje określoną wartość przewidywane.
Statystyki, takie jak średnia, odchylenie standardowe lub WARIANCJA.
Współczynniki i formuły.
Definicja reguły i wskaźniki boczne.
Fragmenty XML opisujących częścią modelu.
Lista typów węzłów
Poniższa tabela zawiera listę różnych typów węzłów, które są dane wyjściowe w modeli wyszukiwanie danych.Ponieważ każdy algorytm przetwarza informacje inaczej, każdy model generuje tylko kilka określonych rodzajów węzłów.Jeśli zmienisz algorytm typów węzłów mogą ulec zmianie.Ponadto jeśli użytkownik ponownie przetworzyć modelu, zawartość każdego węzła mogą ulec zmianie.
Uwaga
Jeśli używasz usługa wyszukiwanie danych inne niż te, w usługach Analysis Services programu SQL Server 2008 lub utworzyć własny dodatek algorytmów, typy dodatkowych węzłów niestandardowe mogą być dostępne.
IDENTYFIKATOR NODE_TYPE |
Etykieta węzła |
Węzeł spis treści |
---|---|---|
1 |
Model |
Metadane i katalog główny węzeł zawartości.Ma zastosowanie do wszystkich typów modeli. |
2 |
Drzewa |
Węzeł główny drzewa klasyfikacji.Stosuje się do modeli drzewo decyzyjne. |
3 |
Wnętrze |
Wnętrze podzielić węzeł w drzewie.Stosuje się do modeli drzewo decyzyjne. |
4 |
Rozkład |
Terminali węzła drzewa.Stosuje się do modeli drzewo decyzyjne. |
5 |
Klaster |
Klaster wykrytych przez algorytm.Stosuje się do usługi klastrowania modeli i klastrowanie modeli sekwencji. |
6 |
Nieznany |
Typ nieznany węzeł. |
7 |
ItemSet |
Itemset wykrytych przez algorytm.Stosuje się do skojarzenia modeli lub sekwencji klastrowanie modeli. |
8 |
AssociationRule |
Reguła skojarzenia wykrytych przez algorytm.Stosuje się do skojarzenia modeli lub sekwencji klastrowanie modeli. |
9 |
PredictableAttribute |
Atrybut przewidywalne.Ma zastosowanie do wszystkich typów modeli. |
10 |
InputAttribute |
Atrybut danych wejściowych.Stosuje się do drzewa decyzji i Naïve Bayes modeli. |
11 |
InputAttributeState |
Statystyka stany atrybut wejściowy.Stosuje się do drzewa decyzji i Naïve Bayes modeli. |
13 |
Sekwencja |
Węzeł najwyższego poziomu dla składnika modelu Markov klastra sekwencji.Stosuje się do kolejności klastrowanie modeli. |
14 |
Przejścia |
Markov przejścia macierzy.Stosuje się do kolejności klastrowanie modeli. |
15 |
TimeSeries |
Inne niż główne węzeł drzewa serii czas.Dotyczy tylko modele serii czas. |
16 |
TsTree |
Węzeł główny drzewa serii czas odpowiadający do szeregu czasowego przewidywalne.Stosuje się do czas serii modeli, i tylko wtedy, gdy model został utworzony za pomocą parametru mieszanego. |
17 |
NNetSubnetwork |
Jeden sub-network.Stosuje się do sieci neuronowe modeli. |
18 |
NNetInputLayer |
Grupa, do której należą węzłów wejściowych warstwy.Stosuje się do sieci neuronowe modeli. |
19 |
NNetHiddenLayer |
Grupy, który zawiera węzły, które opisują ukrytej warstwie.Stosuje się do sieci neuronowe modeli. |
21 |
NNetOutputLayer |
Grupy, które zawiera węzły w warstwie danych wyjściowych.Stosuje się do sieci neuronowe modeli. |
21 |
NNetInputNode |
Węzeł w wejściowym warstwy, która pasuje do atrybut wprowadzania odpowiednich stanów.Stosuje się do sieci neuronowe modeli. |
22 |
NNetHiddenNode |
Węzeł w ukrytej warstwie.Stosuje się do sieci neuronowe modeli. |
23 |
NNetOutputNode |
Węzeł w warstwie danych wyjściowych.Ten węzeł zwykle będzie pasował do atrybut danych wyjściowych i odpowiadające im stanów.Stosuje się do sieci neuronowe modeli. |
24 |
NNetMarginalNode |
Marginalna statystykę zestaw szkoleniowy.Stosuje się do sieci neuronowe modeli. |
25 |
RegressionTreeRoot |
Katalog główny drzewa regresja.Dotyczy regresja liniowej modeli i modele drzewa decyzji, które zawiera ciągłego wprowadzania atrybuty. |
26 |
NaiveBayesMarginalStatNode |
Marginalna statystykę zestaw szkoleniowy.Stosuje się do modeli Naïve Bayes. |
27 |
ArimaRoot |
Węzeł główny ARIMA modelu.Dotyczy tylko tych czas serii modele, które za pomocą algorytmu ARIMA. |
28 |
ArimaPeriodicStructure |
Struktura okresowych w modelu ARIMA.Dotyczy tylko tych czas serii modele, które za pomocą algorytmu ARIMA. |
29 |
ArimaAutoRegressive |
Współczynnik Autoregressive jeden składnik w modelu typu ARIMA. Dotyczy tylko tych czas serii modele, które za pomocą algorytmu ARIMA. |
30 |
ArimaMovingAverage |
Przenoszenie współczynnik średnia pojedynczy termin w modelu ARIMA.Dotyczy tylko tych czas serii modele, które za pomocą algorytmu ARIMA. |
1000 |
CustomBase |
Punkt początkowy dla typów węzłów niestandardowych.Typy węzłów niestandardowe muszą być liczbami całkowitymi przekracza wartość tej stała.Stosuje się do modeli utworzonych przy użyciu algorytmów, niestandardowego dodatku typu plug-in. |
Identyfikator węzła, nazwa, etykieta i opis
Węzeł główny każdego modelu zawsze ma unikatowy (identyfikatorNODE_UNIQUE_NAME) 0.Wszystkie identyfikatory węzła są przypisywane automatycznie poprzez Analysis Services i nie mogą być modyfikowane.
Węzeł katalogu głównego dla każdego modelu zawiera także pewne podstawowe metadane dotyczące modelu.Te metadane zawiera bazy danych usług Analysis Services, gdy model jest przechowywana)MODEL_CATALOG), schemat (MODEL_SCHEMA), a nazwa modelu (NAZWA_MODELU).Jednak te informacje powtarza się w wszystkich węzłów z modelu, dzięki czemu nie trzeba zbadać węzła głównego w celu uzyskania tych metadane.
Oprócz nazwę używaną jako identyfikator unikatowy, każdy węzeł dysponuje Nazwa (NAZWA_WĘZŁA).Ta nazwa jest automatycznie tworzona przez algorytm w celach wyświetlania i nie można edytować.
Uwaga
Algorytm klastrowania firmy Microsoft pozwala użytkownikom na przypisywanie przyjazne nazwy dla każdego klastra.Jednak te przyjazne nazwy nie są zachowywane na serwerze, a jeśli można ponownie przetworzyć modelu, algorytm spowoduje wygenerowanie nowej nazwy klastra.
The caption and description for each node are automatically generated by the algorithm, and serve as labels to help you understand the content of the node.Wygenerowany dla każdego pole tekst zależy od typu modelu.W niektórych przypadkach nazwisko, podpis i opis może zawierać ten sam ciąg, ale w niektórych modelach opis może zawierać dodatkowe informacje.Zobacz temat dotyczący typu poszczególnych modelu szczegóły implementacji.
Uwaga
Serwer usług analiz obsługuje zmianę nazwy węzłów tylko w przypadku konstruowania modeli przy użyciu niestandardowe algorytm dodatek, który implementuje zmiany nazwy.Umożliwia zmianę nazwy, należy zastąpić metody podczas tworzenia dodatku algorytmu.
Węzeł rodzice, elementy podrzędne węzła i Kardynalność węzła
Relacje między nadrzędnym i podrzędność węzłów w strukturze drzewa zależy od wartości kolumna PARENT_UNIQUE_NAME.Ta wartość jest przechowywana w węzła podrzędnego i pozwalają określić identyfikator węzła nadrzędnego.Te informacje mogą być użycia należy wykonać kilka przykładów:
PARENT_UNIQUE_NAME, który ma wartość NULL oznacza, że węzeł jest węzeł najwyższego poziomu w modelu.
Jeśli wartość PARENT_UNIQUE_NAME wynosi 0, węzeł musi być bezpośrednio obiektu podrzędnego z węzeł najwyższego poziomu w modelu.Dzieje się tak, ponieważ identyfikator węzła głównego jest zawsze 0.
Za pomocą funkcji wewnątrz kwerendy DMX (wyszukiwanie danych rozszerzenia) znaleźć obiekty podrzędne lub nadrzędne określonym węźle.Aby uzyskać więcej informacji o korzystaniu z funkcji w kwerendach zobacz Podczas badania modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych).
Relacja odnosi się do liczby elementów zestaw.W kontekście przetworzonych model wyszukiwania, liczebność pozwalają liczby dzieci w określonym węźle.Na przykład, jeśli modelu drzewo decyzyjne ma węzła dla [roczny dochód], a ten węzeł ma dwa węzły podrzędność, jeden dla warunku [roczny dochód] = wysoki, a drugi warunek, [roczny dochód] = niski, wartość CHILDREN_CARDINALITY dla węzła [roczny dochód] może być 2.
Uwaga
W Analysis Services, tylko bezpośrednie podrzędność węzły są uwzględniane przy obliczaniu relacja węzła. Jednak tworzenia niestandardowych algorytm dodatek mogą przeciążać CHILDREN_CARDINALITY policzyć Kardynalność inaczej.Może to być przydatne, na przykład, jeżeli chce się zliczyć całkowitą liczbę elementów podrzędnych, nie tylko bezpośrednie elementy podrzędne.
Mimo że Kardynalność jest liczony w taki sam sposób, w przypadku wszystkich modeli, w jaki sposób interpretowania lub użyj wartości Kardynalność różni się w zależności od typu modelu.Na przykład w klastrowanie modelu, relacja węzeł najwyższego poziomu pozwalają całkowita liczba klastrów, które zostały wykryte.W przypadku innych typów modeli Kardynalność zawsze może mieć wartość zestaw, w zależności od typu węzła.Aby uzyskać więcej informacji dotyczących sposobu interpretowania Kardynalność zobacz temat poświęcony typu pojedynczego modelu.
Uwaga
Niektóre modele, takie jak przez algorytm neuronowe sieci firmy Microsoft zawierają dodatkowo typ węzła specjalny, który zapewnia opisowy statystykę dotyczącą danych szkoleniowych dla całego modelu.Z definicji te węzły nigdy nie mają węzły podrzędność.
Węzeł dystrybucyjny
kolumna NODE_DISTRIBUTION znajduje się tabela zagnieżdżona, że w wielu węzłów zawiera ważne i szczegółowe informacje dotyczące wzorców wykrytych przez algorytm.Dokładne statystyki, znajdującego się w tej tabela zmieniają się w zależności od typu modelu, pozycja węzła w drzewie i przewidywalny atrybut jest, czy wartość liczbową ciągłego discrete wartość; jednak zawierają minimalnej i maksymalnej wartości atrybutu, Waga przypisana do wartości, liczbę przypadków, w węźle Współczynniki użyte w formule regresja i środki statystycznych, takich jak odchylenie standardowe i WARIANCJA.Aby uzyskać więcej informacji dotyczących sposobu interpretowania węzła dystrybucyjnego zobacz temat dla określonego typu typ modelu, w którym pracujesz.
Uwaga
Tabela NODE_DISTRIBUTION może być pusty, w zależności od typu węzła.Na przykład niektóre węzły służą tylko do organizowania kolekcja węzły podrzędność i jest węzły podrzędność, które zawierają szczegółowe dane statystyczne.
Tabela zagnieżdżona NODE_DISTRIBUTION, zawsze zawiera następujące kolumny.Zawartość każdego kolumna może się różnić w zależności od typu modelu.Aby uzyskać więcej informacji na temat typów określonego modelu zobacz Górnictwie model zawartości przez typ algorytmu.
ATTRIBUTE_NAME
Zawartość może być różna w zależności od algorytmu.Może być nazwą kolumna, takie jak atrybut przewidywalny, reguły, an itemset lub fragment informacji wewnętrznych w algorytmie, taki jak część formuły.W tej kolumnie mogą również zawierać para atrybut wartość.
ATTRIBUTE_VALUE
Wartość atrybut o nazwie w ATTRIBUTE_NAME.Jeśli nazwa atrybut jest kolumną, następnie przypadek większości proste ATTRIBUTE_VALUE zawiera discrete wartości dla tej kolumna.
W zależności od tego, jak algorytm przetwarza wartości ATTRIBUTE_VALUE może również zawierać flaga, wskazująca, czy istnieje wartość (atrybutExisting), albo czy wartości null ()Missing).
Na przykład jeśli model znaleźć klientów, którzy zakupili danego elementu, co najmniej raz, kolumna ATTRIBUTE_NAME może zawierać pary atrybut wartość, która definiuje element zainteresowania, takich jak Model = 'Water bottle', a kolumna ATTRIBUTE_VALUE będzie zawierać tylko słowo kluczowe Existing lub Missing.
POMOC TECHNICZNA
Liczba przypadków, które zawierają tę parę atrybut wartość lub zawierają ten itemset lub reguły.Ogólnie rzecz biorąc dla każdego węzła wartość obsługi informuje liczbie spraw zestaw szkolenia są uwzględniane w bieżącym węźle.W większości typów modeli obsługa reprezentuje dokładną liczbę przypadków.Obsługa wartości są przydatne, ponieważ dystrybucji danych można wyświetlać we własnych spraw szkolenia, bez konieczności pobrania danych szkoleniowych.Serwer usług Analysis Services używa również tych wartości przechowywane do obliczania prawdopodobieństwa przechowywanych w stosunku do poprzednich prawdopodobieństwa, można określić, czy wnioskowanie jest mocne lub słabe.
Na przykład w drzewie klasyfikacji, wartość obsługi wskazuje numer sprawy, które zostały opisane kombinację atrybutów.
drzewo decyzyjne sumę pomocy technicznej przy każdym poziom kwot drzewa wsparcia ich węzła nadrzędnego.Na przykład, jeśli model zawiera przypadki 1200 jest dzielony równo według płci, a następnie podzielona równo przez trzy wartości dla wyników — niski, średni i wysoki — węzły podrzędność węzła (2), które są węzłami [4], [5] i [6], zawsze jest Suma na taką samą liczbę przypadków jako węzeł (2).
Identyfikator węzła i atrybuty węzła
Licznik pomocy technicznej
(1) Główny model
1200
[2] Płeć = męska
(3) Płci = gniazdowy
600
600
(4) Płci = męski i zysk = wysoki
(5) Płci = męski i zysk = średni
(6) Płeć = męski i zysk = niski
200
200
200
(7) Płeć = gniazdowy i zysk = wysoki
(8) Płci = gniazdowy i zysk = średni
(9) Płeć = gniazdowy i zysk = niski
200
200
200
Dla klastrów modelu numer pomocy technicznej może ważone dołączyć prawdopodobieństw należących do wielu klastrów.Wiele członkostwa klastra jest ustawieniem domyślnym klastrowanie metoda.W tym scenariuszu ponieważ każdy przypadek nie musi koniecznie należy do klastra tylko jeden, obsługa w tych modeli może nie zwiększają do 100 procent wszystkich klastrów.
PRAWDOPODOBIEŃSTWO
Wskazuje prawdopodobieństwa dla tego określonego węzła w obrębie całego modelu.Ogólnie rzecz biorąc prawdopodobieństwo reprezentuje pomocy technicznej dla określonej wartości, podzielona przez całkowitą liczbę przypadków, w ramach węzła (NODE_SUPPORT).
Jednak prawdopodobieństwa jest korygowana nieco wyeliminować odchylenia spowodowane przez brak wartości w danych.
Na przykład jeśli bieżące wartości [Suma elementy podrzędne] "Jeden" i "Druga", należy unikać tworzenia modelu, który przewiduje, że nie jest możliwe, aby mieć nie elementów podrzędnych lub ma trzy elementy podrzędne.W celu zapewnienia, że brakuje wartości improbable, ale nie uniemożliwia, algorytm zawsze dodaje 1 do liczby rzeczywistej wartości żadnych atrybut.
Przykład:
Prawdopodobieństwo [dzieci razem = jedna] = [liczba przypadków, gdy suma dzieci jedna =] + 1 / [liczba wszystkich przypadkach] + 3
Prawdopodobieństwo [dzieci razem = 2] = [liczba przypadków, gdy całkowita dzieci = 2] + 1 / [liczba wszystkich przypadkach] + 3
Uwaga
Dostosowanie 3 jest obliczana przez dodanie 1 do całkowitej liczby istniejących wartości n.
Po dostosowaniu prawdopodobieństw dla wszystkich wartości nadal dodawać do 1.Prawdopodobieństwo dla wartości bez danych (w tym przykładzie [dzieci razem = "Zero", "3" lub pewną inną wartość]), rozpoczyna się na bardzo niskim poziomie różna od zera i zwiększa się powoli podczas dodawania więcej przypadków.
ODCHYLENIE
Wskazuje odchylenie od wartości w węźle.Z definicji odchylenie jest zawsze 0 dla wartości discrete.Jeśli model obsługuje wartości stałe, odchylenie jest obliczana jako Σ (sigma), przy użyciu mianownik nlub liczbę przypadków, w węźle.Istnieją dwie definicje ogólny używany do reprezentowania (odchylenie standardoweStDev). Jedną metodę obliczania odchylenia standardowego uwzględnia odchylenia konta, a inna metoda oblicza odchylenie standardowe bez użycia odchylenia.Ogólnie rzecz biorąc algorytmów wyszukiwanie danych firmy Microsoft nie należy używać odchylenia, podczas obliczania odchylenia standardowego.
Wartość, która pojawia się w tabela NODE_DISTRIBUTION jest rzeczywista wartość dla wszystkich atrybutów discrete i discretized i średniej dla wartości stałe.
VALUE_TYPE
Wskazuje typ danych atrybut lub wartości i użycie wartości.Niektóre typy wartości są stosowane tylko do niektórych typów modeli:IDENTYFIKATOR VALUE_TYPE
Etykieta wartości
Nazwa typu wartości
1
Brak
Wskazuje, że dane przypadek nie zawiera wartości dla tego atrybut.The Missing state is calculated separately from attributes that have values.
2
Istniejące
Wskazuje, że przypadków dane zawierają wartość tego atrybut.
3
Ciągłe
Wskazuje, że wartość atrybut jest wartością liczbową ciągłe i dlatego może być reprezentowany przez średnią, wraz z wariancji i odchylenia standardowego.
4
Discrete
Wskazuje wartość numeryczną lub tekst, który jest traktowany jako discrete.
Uwaga Discrete wartości mogą być również brak; jednak ich są obsługiwane w odmienny sposób podczas obliczeń.Aby uzyskać informacje Zobacz Brak wartości (Analysis Services — wyszukiwanie danych).
5
Discretized
Wskazuje, że atrybut zawiera wartości liczbowe, które mają zostać discretized.Wartość będzie sformatowany ciąg znakowy opisujący pakiety discretization.
6
Istniejące
Indicates that the attribute has continuous numeric values and that values have been supplied in the data, vs.values that are missing or inferred.
7
Współczynnik
Wskazuje wartość liczbową przedstawiającą współczynnik.
Współczynnik jest wartością, która jest stosowana przy obliczaniu wartości zmiennej zależnej.Na przykład jeśli model tworzy formuły regresja prognozuje dochodu oparte na wiek, współczynnik jest używany w formułę, której dotyczy przychód wieku.
8
Wynik zysku
Wskazuje wartość numeryczną, która reprezentuje wynik zysku dla atrybut.
9
Statystyki
Wskazuje wartość numeryczną, która reprezentuje statystykę listy regressor.
10
Unikatowa nazwa węzła
Wskazuje, że wartość nie powinny być traktowane nie jako numerycznym lub ciąg znaków, ale jako identyfikator unikatowy innego węzła zawartości w modelu.
Na przykład model sieci neuronowe identyfikatory zawierają wskaźniki z węzłów w warstwie danych wyjściowych do węzłów w ukrytej warstwie i z węzłów w ukrytej warstwie węzły w warstwie wprowadzania.
11
Punkt przecięcia z osią
Wskazuje wartość numeryczną, która reprezentuje punkt przecięcia z osią w formule regresja.
12
Okresowość
Wskazuje, że wartość oznacza okresowej struktury modelu.
Ma zastosowanie tylko do czas serii modeli, które zawierają model ARIMA.
Note:algorytm serii czasowych firmy Microsoft automatycznie wykrywa okresowej struktury na podstawie danych szkoleniowych.W rezultacie terminy ostateczne modelu może zawierać wartości okresowości, które użytkownik nie dostarczył jako parametr podczas tworzenia modelu.13
Kolejność Autoregressive
Wskazuje, czy wartość odpowiada liczbie autoregressive serii.
Stosuje się do czas serii modeli, w których za pomocą algorytmu ARIMA.
14
Przenoszenie zamówienia średnia
Reprezentuje wartość, która reprezentuje liczbę średnich ruchomych w serii.
Stosuje się do czas serii modeli, w których za pomocą algorytmu ARIMA.
15
Różnica zamówienia
Wskazuje, że reprezentuje wartość wartość, która wskazuje, ile razy z serii numeracji jest zróżnicowana.
Stosuje się do czas serii modeli, w których za pomocą algorytmu ARIMA.
16
Boolean
Reprezentuje typ logiczny.
17
Inne
Reprezentuje wartość niestandardowe zdefiniowane przez algorytm.
18
Ciąg prerendered
Reprezentuje wartość niestandardowego renderujący algorytm jako ciąg znaków.Formatowanie nie została zastosowana za pomocą modelu obiektów.
Typy wartości są obliczane na podstawie wyliczenia ADMOMD.NET.Aby uzyskać więcej informacji zobaczMiningValueType.
Wynik węzła
Znaczenie wynik węzła różni się w zależności od typu modelu i mogą być określone dla typu węzła również.Aby uzyskać informacje dotyczące sposobu obliczania NODE_SCORE dla każdego typu modelu i węzłów zobacz Zawartość model wyszukiwania przez typ algorytmu.
Prawdopodobieństwo węzła i prawdopodobieństwo Marginal
Zestaw wierszy schematu model wyszukiwania zawiera kolumny NODE_PROBABILITY i MARGINAL_PROBABILITY dla wszystkich typów modeli.Te kolumny zawierają wartości tylko w węzłach, gdzie znaczenie jest wartość prawdopodobieństwa.Węzeł główny model nigdy nie zawiera na przykład wynik prawdopodobieństwa.
W tych węzłów, które są dostępne wyniki prawdopodobieństwa prawdopodobieństwo węzła i marginalna prawdopodobieństw reprezentują różnych obliczeń.
Marginalna prawdopodobieństwa jest prawdopodobieństwo osiągnięcia węzeł ze swojej witryny nadrzędnej.
Prawdopodobieństwo węzła jest prawdopodobieństwo osiągnięcia węzła z katalogu głównego.
Prawdopodobieństwo węzła jest zawsze mniejsza niż lub równa marginalna prawdopodobieństwa.
Na przykład jeśli zapełnianie wszystkich odbiorców drzewo decyzyjne jest podzielona równo według płci (a nie ma żadnych wartości), prawdopodobieństwo węzły podrzędność powinny być 0,5.Jednak Załóżmy, że każdy z węzłów dla płci jest dzielony równo według poziomu dochodów — wysoki, średni i niski.W takim przypadek wynik MARGINAL_PROBABILITY dla każdego węzła podrzędnego powinien zawsze być.33, ale wartość NODE_PROBABILTY będą produktu prawdopodobieństw wszystkie prowadzące do tego węzła i w ten sposób zawsze mniej niż MARGINAL_PROBABILITY wartości.
Poziom węzła/atrybut i wartości |
Marginalna prawdopodobieństwa |
Prawdopodobieństwo węzła |
---|---|---|
Model główny Wszystkich klientów miejsce docelowe |
1 |
1 |
Podział według płci klientów miejsce docelowe |
.5 |
.5 |
Klientów miejsce docelowe podzielić według płci i dzielenie ponownie trzy sposoby przy dochodu |
.33 |
.5 * .33 = .165 |
Węzeł Zasady i reguły Marginal
Zestaw wierszy schematu model wyszukiwania zawiera także kolumny NODE_RULE i MARGINAL_RULE dla wszystkich typów modelu.Te kolumny zawierają fragmenty XML, które mogą być używane do serializacji modelu lub stanowić część struktury modelu.Kolumny te mogą być puste w przypadku niektórych węzłach, jeśli wartość jest pozbawione sensu.
Są dwa rodzaje reguł XML pod warunkiem, że, podobne do dwóch rodzajów wartości prawdopodobieństwa.Fragment XML w MARGINAL_RULE definiuje atrybut i wartość dla bieżącego węzła należy fragmentu XML w NODE_RULE opisuje ścieżka do bieżącego węzła z modelu głównego.
Powrót do początku
Zawartość model wyszukiwania przez typ algorytmu
Każdy algorytm przechowywane są różnego rodzaju informacje jako część jej zawartości schematu.Na przykład Microsoft Klastrowanie algorytm generuje wiele węzłów podrzędność, z których każdy reprezentuje możliwości klastra. Każdy węzeł klastra zawiera zarówno reguły, które opisują właściwości współużytkowane przez elementy w klastrze.Z drugiej strony Microsoft Algorytm regresja liniowej nie zawiera żadnych węzłów podrzędność; zamiast tego węzła nadrzędnego dla modelu zawiera równanie, które opisuje relację liniowej wykryte przez analizę.
Poniższa tabela zawiera łącza do tematów, dla każdego typu algorytmu.
Model zawartości tematów: Wyjaśnienie znaczenia każdego typu węzła dla każdego typu algorytmu i zapewnić wskazówki o tym, które węzły mogą być przydatne większość w typie określonym modelu.
Podczas badania tematów: Zawierają przykłady kwerend typu określonego modelu i wskazówki dotyczące interpretacji wyniki.
Narzędzia do przeglądania zawartości model wyszukiwania
Podczas przeglądania lub eksplorowania modelu w Business Intelligence Development Studio, można wyświetlać informacje w Podgląd zawartości drzewa rodzajowa firmy Microsoft, która jest dostępna w obu Business Intelligence Development Studio i SQL Server Management Studio.
The Microsoft Generic Content Viewer displays the columns, rules, properties, attributes, nodes, and other content from the model by using the same information that is available in the content zestaw wierszy schematu of the model wyszukiwania. Zestaw wierszy zawartość schematu jest rodzajowy ramy do prezentowania szczegółowe informacje na temat zawartości model wyszukiwanie danych.Model zawartości można przeglądać w dowolnym klient, który obsługuje hierarchicznych zestawów wierszy.W przeglądarce Business Intelligence Development Studio przedstawia te informacje w podglądzie tabela HTML, reprezentujący wszystkie modele w spójny format, co ułatwia zrozumienie struktury modeli, które tworzysz. Aby uzyskać więcej informacji zobaczWyświetlanie szczegółowe informacje o modelu z podglądem drzewa zawartości rodzajowa firmy Microsoft.
Powrót do początku
Narzędzia do Kwerenda model wyszukiwania zawartości
W celu pobrania zawartości modeli wyszukiwania, należy utworzyć kwerendę przeciwko wyszukiwanie danych modelu.
Najprostszym sposobem utworzenia kwerendy zawartości ma wykonać następującą instrukcję DMX w SQL Server Management Studio:
SELECT * FROM [<mining model name>].CONTENT
Aby uzyskać więcej informacji zobaczPodczas badania modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych).
Za pomocą zestawów wierszy schematu wyszukiwanie danych, wykonać kwerendę model wyszukiwania zawartości.zestaw zestaw wierszy schematu jest standardowy strukturę, której klienci używają do wykrycia, przeglądanie i zbadać informacji o strukturach wyszukiwania i modeli.Zestawy wierszy schematu mogą wysyłać kwerendy za pomocą XMLA, języka Transact-SQL lub DMX instrukcji.
W SQL Server 2008, użytkownik może również uzyskać dostęp informacje zawarte w wyszukiwanie danych zestawów wierszy schematu połączenia z serwerem usług Analysis Services, otwierając i badanie tabele systemowe. Aby uzyskać więcej informacji o korzystaniu z instrukcji SELECT, aby zestawów wierszy kwerendy danych wyszukiwania schematu Zobacz Troubleshooting Tools (Analysis Services - Data Mining).
Powrót do początku
See Also