PredictCaseLikelihood (DMX)
Diese Funktion gibt die Wahrscheinlichkeit zurück, mit der ein Eingabefall in ein vorhandenes Modell passt. Wird nur mit Clustermodellen verwendet.
Syntax
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
Argumente
NORMALIZED
Der Rückgabewert enthält die Wahrscheinlichkeit des Falls im Modell geteilt durch die Wahrscheinlichkeit des Falls ohne Modell.NONNORMALIZED
Der Rückgabewert enthält die interne Wahrscheinlichkeit des Falls, bei der es sich um das Produkt aus den Wahrscheinlichkeiten der Fallattribute handelt.
Betrifft
Modelle, die mit dem Microsoft Clustering- oder dem Microsoft Sequence Clustering-Algorithmus erstellt wurden.
Rückgabetyp
Eine Gleitkommazahl doppelter Genauigkeit zwischen 0 und 1. Bei einer Zahl, die näher an 1 liegt, steigt die Wahrscheinlichkeit, dass der Fall in diesem Modell auftritt. Bei einer Zahl, die näher an 0 liegt, sinkt die Wahrscheinlichkeit, dass der Fall in diesem Modell auftritt.
Hinweise
Ein Ergebnis der PredictCaseLikelihood-Funktion ist standardmäßig normalisiert. Normalisierte Werte sind in der Regel nützlicher, weil die Anzahl von Attributen in einem Fall zunimmt und die Unterschiede zwischen den internen Wahrscheinlichkeiten zweier Fälle erheblich geringer werden.
Die folgende Gleichung dient zur Berechnung der normalisierten Werte, wobei X und Y gegeben sind:
x = Wahrscheinlichkeit für den Fall auf Grundlage des Clusteringmodells
y = Marginale Fallwahrscheinlichkeit, berechnet als logarithmische Wahrscheinlichkeit des Falls auf Grundlage der Zählung der Trainingsfälle
Z = Exp( log(x) – Log(Y))
Normalisiert = (z/ (1+z))
Beispiele
Im folgenden Beispiel wird die Wahrscheinlichkeit zurückgegeben, mit der der angegebene Fall innerhalb des Clustermodells auftritt, das auf der Adventure Works DW-Datenbank basiert.
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
Erwartete Ergebnisse:
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6,30672792729321E-08 |
6,30672792729321E-08 |
9,5824454056846E-48 |
Der Unterschied zwischen diesen Ergebnissen veranschaulicht den Effekt der Normalisierung. Der Rohwert für CaseLikelihood deutet an, dass die Wahrscheinlichkeit des Falls bei ca. 20 Prozent liegt; bei einer Normalisierung der Ergebnisse wird jedoch deutlich, dass die Wahrscheinlichkeit des Falls gering ist.
Siehe auch
Verweis
Data Mining-Erweiterungen (DMX) - Funktionsreferenz
Allgemeine Vorhersagefunktionen (DMX)