Udostępnij przez


ClusterDistance (DMX)

The ClusterDistance funkcja returns the distance of the input przypadek from the specified cluster, or if no cluster is specified, the distance of the input przypadek from the most likely cluster.

ClusterDistance([<ClusterID expression>])

Dotyczy

Ta funkcja może być używana tylko wtedy, gdy dane źródłowe model wyszukiwania obsługuje klastrowanie.Funkcja może być używany z dowolnego rodzaju klastrowanie modelu (EM K-oznacza itp.), ale wyniki różnią się w zależności od algorytmu.

Zwracany typ

Wartość wartość skalarna.

Remarks

The ClusterDistance funkcja returns the distance between the input przypadek and the cluster that has the highest probability for that input przypadek.

przypadek średniej K klastrowanie, ponieważ wszystkie przypadek mogą należeć do klastra tylko jeden z masą członkostwa 1.0, odległość klastra jest zawsze 0.Jednak w K-oznacza każdy klaster przyjmowana jest posiadanie środek strefy.Wartość środek strefy można uzyskać przez wyszukiwanie lub przeglądanie NODE_DISTRIBUTION tabela zagnieżdżona w modelu zawartości wyszukiwania.Aby uzyskać więcej informacji zobaczmodel wyszukiwania Zawartości dla klastrowanie modele (Analysis Services — wyszukiwanie danych).

przypadek wystąpienia domyślnego EM klastrowanie metoda, wszystkie punkty wewnątrz klastra są uważane za równie prawdopodobne, dlatego zgodnie z projektem jest nie środek strefy dla klastra.Wartość ClusterDistance między konkretnym przypadek i określonego klastra N jest obliczana w następujący sposób:

ClusterDistance(N) =1–(membershipWeight(N))

Lub:

ClusterDistance(N) =1–ClusterProbability (N))

Pokrewne funkcje prognozowania

Analysis Services podczas badania modeli klastrów udostępnia następujące dodatkowe funkcje:

  • Użycie Klaster (DMX) funkcja zwracająca najprawdopodobniej klastra.

  • Użycie ClusterProbability (DMX) Funkcja uzyskanie prawdopodobieństwo, że przypadek należy do określonego klastra. Ta wartość stanowi odwrotność odległość klastra.

  • Użycie PredictHistogram (DMX) funkcja zwracająca histogramu prawdopodobieństwa wejściowy istniejącej przypadek w każdym z klastrów w modelu.

  • Użycie PredictCaseLikelihood (DMX) funkcja zwracająca miara z zakresu od 0 do 1, wskazująca, jaki może wejściowe przypadek ma istnieć biorąc pod uwagę rozpoznane przez algorytm modelu.

Example1: Uzyskiwanie odległość klastrów do najbardziej prawdopodobnym klastrowania

W poniższym przykładzie są zwracane odległość od określonego przypadek przypadek najprawdopodobniej należącego do klastra.

SELECT
    ClusterDistance()
FROM
    [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
    '2-5 Miles' AS [Commute Distance],
    'Graduate Degree' AS [Education],
    0 AS [Number Cars Owned],
    0 AS [Number Children At Home]) AS t

Przykład wyniki:

Expression

0.0477390930705145

Aby dowiedzieć się, to klastra, można zastąpić Cluster dla ClusterDistance w poprzednim przykładzie.

Przykład wyniki:

$ KLASTRA

Klaster 6

Example2: Uzyskiwanie odległość do określony klastrowania

Następująca składnia używa zestaw wierszy zawartości schematu model wyszukiwania zwraca listę identyfikatorów węzła i podpisy węzła dla klastrów w modelu wyszukiwania.Następnie można użyć podpisu węzeł jako argumentu Identyfikator klastra w ClusterDistance Funkcja.

SELECT NODE_UNIQUE_NAME, NODE_CAPTION 
FROM <model>.CONTENT 
WHERE NODE_TYPE = 5

Przykład wyniki:

NODE_UNIQUE_NAME

NODE_CAPTION

001

Klaster 1

002

Klaster 2

W poniższym przykładzie składni zwraca odległość określoną sprawę z etykietą Cluster 2 klastra.

SELECT
    ClusterDistance('Cluster 2')
AS [Cluster 2 Distance]
FROM [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
    '2-5 Miles' AS [Commute Distance],
    'Graduate Degree' AS [Education],
    0 AS [Number Cars Owned],
    0 AS [Number Children At Home]) AS t

Przykład wyniki:

Cluster 2 odległość

0.97008209236394