ClusterDistance (DMX)
The ClusterDistance funkcja returns the distance of the input przypadek from the specified cluster, or if no cluster is specified, the distance of the input przypadek from the most likely cluster.
ClusterDistance([<ClusterID expression>])
Dotyczy
Ta funkcja może być używana tylko wtedy, gdy dane źródłowe model wyszukiwania obsługuje klastrowanie.Funkcja może być używany z dowolnego rodzaju klastrowanie modelu (EM K-oznacza itp.), ale wyniki różnią się w zależności od algorytmu.
Zwracany typ
Wartość wartość skalarna.
Remarks
The ClusterDistance funkcja returns the distance between the input przypadek and the cluster that has the highest probability for that input przypadek.
przypadek średniej K klastrowanie, ponieważ wszystkie przypadek mogą należeć do klastra tylko jeden z masą członkostwa 1.0, odległość klastra jest zawsze 0.Jednak w K-oznacza każdy klaster przyjmowana jest posiadanie środek strefy.Wartość środek strefy można uzyskać przez wyszukiwanie lub przeglądanie NODE_DISTRIBUTION tabela zagnieżdżona w modelu zawartości wyszukiwania.Aby uzyskać więcej informacji zobaczmodel wyszukiwania Zawartości dla klastrowanie modele (Analysis Services — wyszukiwanie danych).
przypadek wystąpienia domyślnego EM klastrowanie metoda, wszystkie punkty wewnątrz klastra są uważane za równie prawdopodobne, dlatego zgodnie z projektem jest nie środek strefy dla klastra.Wartość ClusterDistance między konkretnym przypadek i określonego klastra N jest obliczana w następujący sposób:
ClusterDistance(N) =1–(membershipWeight(N))
Lub:
ClusterDistance(N) =1–ClusterProbability (N))
Pokrewne funkcje prognozowania
Analysis Services podczas badania modeli klastrów udostępnia następujące dodatkowe funkcje:
Użycie Klaster (DMX) funkcja zwracająca najprawdopodobniej klastra.
Użycie ClusterProbability (DMX) Funkcja uzyskanie prawdopodobieństwo, że przypadek należy do określonego klastra. Ta wartość stanowi odwrotność odległość klastra.
Użycie PredictHistogram (DMX) funkcja zwracająca histogramu prawdopodobieństwa wejściowy istniejącej przypadek w każdym z klastrów w modelu.
Użycie PredictCaseLikelihood (DMX) funkcja zwracająca miara z zakresu od 0 do 1, wskazująca, jaki może wejściowe przypadek ma istnieć biorąc pod uwagę rozpoznane przez algorytm modelu.
Example1: Uzyskiwanie odległość klastrów do najbardziej prawdopodobnym klastrowania
W poniższym przykładzie są zwracane odległość od określonego przypadek przypadek najprawdopodobniej należącego do klastra.
SELECT
ClusterDistance()
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
Przykład wyniki:
Expression |
|---|
0.0477390930705145 |
Aby dowiedzieć się, to klastra, można zastąpić Cluster dla ClusterDistance w poprzednim przykładzie.
Przykład wyniki:
$ KLASTRA |
|---|
Klaster 6 |
Example2: Uzyskiwanie odległość do określony klastrowania
Następująca składnia używa zestaw wierszy zawartości schematu model wyszukiwania zwraca listę identyfikatorów węzła i podpisy węzła dla klastrów w modelu wyszukiwania.Następnie można użyć podpisu węzeł jako argumentu Identyfikator klastra w ClusterDistance Funkcja.
SELECT NODE_UNIQUE_NAME, NODE_CAPTION
FROM <model>.CONTENT
WHERE NODE_TYPE = 5
Przykład wyniki:
NODE_UNIQUE_NAME |
NODE_CAPTION |
|---|---|
001 |
Klaster 1 |
002 |
Klaster 2 |
W poniższym przykładzie składni zwraca odległość określoną sprawę z etykietą Cluster 2 klastra.
SELECT
ClusterDistance('Cluster 2')
AS [Cluster 2 Distance]
FROM [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
Przykład wyniki:
Cluster 2 odległość |
|---|
0.97008209236394 |