PredictCaseLikelihood (DMX)
適用対象:SQL Server Analysis Services
この関数は、入力ケースが既存のモデルに収まる可能性を返します。 クラスタリング モデルでのみ使用されます。
構文
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
引数
NORMALIZED
戻り値は、モデル内のケースの確率をモデルのないケースの確率で除算した結果を格納します。
非正規化
戻り値は、ケースの未加工の確率、つまりケース属性の確率の積を格納します。
適用対象
Microsoft クラスタリングアルゴリズムと Microsoft シーケンス クラスタリング アルゴリズムを使用して構築されたモデル。
返り値の種類
0 ~ 1 の倍精度浮動小数点数。 1 に近い数値は、ケースがこのモデルで発生する可能性が高いことを示します。 値が 0 に近いほど、このモデルでケースが発生する確率が低くなります。
解説
既定では、 PredictCaseLikelihood 関数の結果は正規化されます。 通常、正規化された値は、ケース内の属性の数が増え、任意の 2 つのケースの未加工の確率の差が小さくなるほど、有用性が増します。
x と y を指定して正規化された値を計算するには、次の式を使用します。
x = クラスタリング モデルに基づいたケースの確率値
y = 限界ケース尤度。トレーニング ケースのカウントに基づいてケースの対数尤度として計算されます
Z = Exp( log(x) - Log(Y))
Normalized = (z/ (1+z))
例
次の例では、Adventure Works DW データベースに基づくクラスタリング モデル内で、指定したケースが発生する可能性を返します。
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
期待される結果:
Default_Likelihood | Normalized_Likelihood | Raw_Likelihood |
---|---|---|
6.30672792729321E-08 | 6.30672792729321E-08 | 9.5824454056846E-48 |
これらの結果の違いは、正規化の影響を示します。 CaseLikelihoodの生の値は、ケースの確率が約 20% であることを示しますが、結果を正規化すると、ケースの可能性が非常に低いことが明らかになります。
参照
データ マイニング アルゴリズム (Analysis Services - データ マイニング)
データ マイニング拡張機能 (DMX) 関数リファレンス
関数 (DMX)
一般的な予測関数 (DMX)