Compartilhar via


PredictCaseLikelihood (DMX)

Esta função retorna a probabilidade de um caso de entrada se ajustar no modelo existente. Usado somente com modelos de cluster.

Sintaxe

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

Argumentos

  • NORMALIZED
    O valor de retorno contém a probabilidade do caso com o modelo dividido pela probabilidade do caso sem o modelo.

  • NONNORMALIZED
    O valor de retorno contém a probabilidade bruta do caso, que é o produto das probabilidades dos atributos de caso.

Aplica-se a

Modelos que são criados com os algoritmos Microsoft Clustering e Microsoft MSC.

Tipo de retorno

Número de ponto flutuante da dupla precisão entre 0 e 1. Um número próximo de 1 indica que o caso tem uma alta probabilidade de ocorrer neste modelo. Um número próximo de 0 indica que o caso tem pouca probabilidade de ocorrer neste modelo.

Comentários

Por padrão, o resultado da função PredictCaseLikelihood é normalizado. Em geral, os valores normalizados são mais úteis à medida que o número de atributos de um caso aumenta e as diferenças entre as probabilidades brutas de quaisquer dois casos tornam-se muito menores.

A seguinte equação é usada para calcular os valores normalizados, determinados x e y:

  • x = probabilidade do caso baseada no modelo de cluster

  • y = probabilidade de caso marginal, calculada como a probabilidade de log do caso com base na contagem dos casos de treinamento

  • Z = Exp( log(x) – Log(Y))

Normalizado = (z/ (1+z))

Exemplos

O exemplo a seguir retorna a probabilidade de o caso específico ocorrer no modelo de cluster, que é baseado no banco de dados Adventure Works DW.

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

Resultados esperados:

Default_Likelihood

Normalized_Likelihood

Raw_Likelihood

6.30672792729321E-08

6.30672792729321E-08

9.5824454056846E-48

A diferença entre esses resultados demonstra o efeito da normalização. O valor bruto para CaseLikelihood sugere que a probabilidade do caso é aproximadamente 20 por cento; entretanto, quando você normaliza os resultados, torna-se aparente que a probabilidade do caso é muito baixa.

Consulte também

Referência

Referência de função de DMX (Data Mining Extensions)

Funções (DMX)

Funções de previsão gerais (DMX)

Conceitos

Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)