PredictCaseLikelihood (DMX)

适用于: SQL Server Analysis Services

此函数返回输入事例适合现有模型的可能性。 仅适用于聚类分析模型。

语法

  
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])  

参数

NORMALIZED
返回值包含事例在模型中的概率除以事例不在模型中的概率所得的值。

NONNORMALIZED
返回值包含事例的原始概率,即事例属性概率的乘积。

应用于

使用Microsoft聚类分析和Microsoft序列聚类分析算法生成的模型。

返回类型

介于 0 和 1 之间的双精度浮点数。 该数值越接近 1,则指示事例出现在此模型中的概率越高。 该数值越接近 0,则指示事例越不可能出现在此模型中。

注解

默认情况下,PredictCaseLikelihood 函数的结果已规范化。 通常,当事例中的属性个数增加,并且任何两个事例的原始概率之间的差异大大缩小时,规范化的值更为有用。

下面的公式用于计算规范化的值(给定 x 和 y):

  • x = 事例基于聚类分析模型的可能性

  • y = 边缘事例可能性(计算为事例基于计数定型事例的对数可能性)

  • Z = Exp(log(x) - Log(Y))

规范化 = (z/ (1+z))

示例

以下示例返回在基于 Adventure Works DW 数据库的聚类分析模型中发生指定事例的可能性。

SELECT  
  PredictCaseLikelihood() AS Default_Likelihood,  
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,  
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,  
FROM  
  [TM Clustering]  
NATURAL PREDICTION JOIN  
(SELECT 28 AS [Age],  
  '2-5 Miles' AS [Commute Distance],  
  'Graduate Degree' AS [Education],  
  0 AS [Number Cars Owned],  
  0 AS [Number Children At Home]) AS t  

预期的结果:

Default_Likelihood Normalized_Likelihood Raw_Likelihood
6.30672792729321E-08 6.30672792729321E-08 9.5824454056846E-48

上述结果的差异演示了规范化的效果。 CaseLikelihood 的原始值表明事例的概率约为 20%;但是,当你规范化结果时,很明显,事例的可能性非常低。

另请参阅

数据挖掘算法 (Analysis Services - 数据挖掘)
数据挖掘扩展插件 (DMX) 函数参考
函数 (DMX)
通用预测函数 (DMX)