PredictCaseLikelihood (DMX)

此函数返回输入事例适合现有模型的可能性。仅适用于聚类分析模型。

语法

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

参数

  • NORMALIZED
    返回值包含事例在模型中的概率除以事例不在模型中的概率所得的值。

  • NONNORMALIZED
    返回值包含事例的原始概率,即事例属性概率的乘积。

适用范围

使用 Microsoft 聚类分析和 Microsoft 顺序分析和聚类分析算法生成的模型。

返回类型

介于 0 和 1 之间的双精度浮点数。该数值越接近 1,则指示事例出现在此模型中的概率越高。该数值越接近 0,则指示事例越不可能出现在此模型中。

注释

默认情况下,PredictCaseLikelihood 函数的结果将被规范化。通常,当事例中的属性个数增加,并且任何两个事例的原始概率之间的差异大大缩小时,规范化的值更为有用。

下面的公式用于计算规范化的值(给定 x 和 y):

  • x = 事例基于聚类分析模型的可能性

  • y = 边缘事例可能性(计算为事例基于计数定型事例的对数可能性)

  • Z = Exp( log(x) – Log(Y))

规范化值 = (z/ (1+z))

示例

以下示例返回在基于 Adventure Works DW 数据库的聚类分析模型中出现指定事例的可能性。

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

预期的结果:

Default_Likelihood

Normalized_Likelihood

Raw_Likelihood

6.30672792729321E-08

6.30672792729321E-08

9.5824454056846E-48

上述结果的差异演示了规范化的效果。CaseLikelihood 的原始值表明该事例的概率约为 20%;但是规范化结果之后,很明显事例的概率大大降低。