PredictCaseLikelihood (DMX)
この関数は、入力ケースが既存のモデル内に収まる確率を返します。クラスター モデルでのみ使用されます。
構文
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
引数
NORMALIZED
戻り値は、モデル内のケースの確率をモデルのないケースの確率で除算した結果を格納します。NONNORMALIZED
戻り値は、ケースの未加工の確率、つまりケース属性の確率の積を格納します。
適用対象
Microsoft クラスタリング アルゴリズムと Microsoft シーケンス クラスター アルゴリズムを使用して作成されるモデルです。
戻り値の型
0 ~ 1 の範囲の倍精度浮動小数点値です。値が 1 に近いほど、このモデルでケースが発生する確率が高くなります。値が 0 に近いほど、このモデルでケースが発生する確率が低くなります。
説明
既定では、PredictCaseLikelihood 関数の結果は正規化されます。通常、正規化された値は、ケース内の属性の数が増え、任意の 2 つのケースの未加工の確率の差が小さくなるほど、有用性が増します。
x と y を指定した、次の式を使用して、正規化された値を計算します。
x = クラスタリング モデルに基づいたケースの確率値
y = トレーニング ケースの数に基づいたケースの対数尤度として計算された、周辺確率の値
Z = Exp( log(x) – Log(Y))
正規化 = (z/ (1+z))
例
次の例は、指定したケースが Adventure Works DW データベースに基づいたクラスター モデル内に発生する確率値を返します。
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
期待される結果:
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6.30672792729321E-08 |
6.30672792729321E-08 |
9.5824454056846E-48 |
これらの結果の違いは、正規化の影響を示します。CaseLikelihood の未加工の値からは、ケースの確率が約 20% であることが示唆されますが、結果を正規化すると、ケースの発生確率が非常に低いことが明らかになります。