次の方法で共有


PredictCaseLikelihood (DMX)

適用対象:SQL Server Analysis Services

この関数は、入力ケースが既存のモデルに収まる可能性を返します。 クラスタリング モデルでのみ使用されます。

構文

  
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])  

引数

NORMALIZED
戻り値は、モデル内のケースの確率をモデルのないケースの確率で除算した結果を格納します。

非正規化
戻り値は、ケースの未加工の確率、つまりケース属性の確率の積を格納します。

適用対象

Microsoft クラスタリングアルゴリズムと Microsoft シーケンス クラスタリング アルゴリズムを使用して構築されたモデル。

返り値の種類

0 ~ 1 の倍精度浮動小数点数。 1 に近い数値は、ケースがこのモデルで発生する可能性が高いことを示します。 値が 0 に近いほど、このモデルでケースが発生する確率が低くなります。

解説

既定では、 PredictCaseLikelihood 関数の結果は正規化されます。 通常、正規化された値は、ケース内の属性の数が増え、任意の 2 つのケースの未加工の確率の差が小さくなるほど、有用性が増します。

x と y を指定して正規化された値を計算するには、次の式を使用します。

  • x = クラスタリング モデルに基づいたケースの確率値

  • y = 限界ケース尤度。トレーニング ケースのカウントに基づいてケースの対数尤度として計算されます

  • Z = Exp( log(x) - Log(Y))

Normalized = (z/ (1+z))

次の例では、Adventure Works DW データベースに基づくクラスタリング モデル内で、指定したケースが発生する可能性を返します。

SELECT  
  PredictCaseLikelihood() AS Default_Likelihood,  
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,  
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,  
FROM  
  [TM Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 28 AS [Age],  
  '2-5 Miles' AS [Commute Distance],  
  'Graduate Degree' AS [Education],  
  0 AS [Number Cars Owned],  
  0 AS [Number Children At Home]) AS t  

期待される結果:

Default_Likelihood Normalized_Likelihood Raw_Likelihood
6.30672792729321E-08 6.30672792729321E-08 9.5824454056846E-48

これらの結果の違いは、正規化の影響を示します。 CaseLikelihoodの生の値は、ケースの確率が約 20% であることを示しますが、結果を正規化すると、ケースの可能性が非常に低いことが明らかになります。

参照

データ マイニング アルゴリズム (Analysis Services - データ マイニング)
データ マイニング拡張機能 (DMX) 関数リファレンス
関数 (DMX)
一般的な予測関数 (DMX)