PredictCaseLikelihood (DMX)
Esta função retorna a probabilidade de um caso de entrada se ajustar no modelo existente. Usado somente com modelos de cluster.
Sintaxe
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
Argumentos
NORMALIZED
O valor de retorno contém a probabilidade do caso com o modelo dividido pela probabilidade do caso sem o modelo.NONNORMALIZED
O valor de retorno contém a probabilidade bruta do caso, que é o produto das probabilidades dos atributos de caso.
Aplica-se a
Modelos que são criados com os algoritmos Microsoft Clustering e Microsoft MSC.
Tipo de retorno
Número de ponto flutuante da dupla precisão entre 0 e 1. Um número próximo de 1 indica que o caso tem uma alta probabilidade de ocorrer neste modelo. Um número próximo de 0 indica que o caso tem pouca probabilidade de ocorrer neste modelo.
Comentários
Por padrão, o resultado da função PredictCaseLikelihood é normalizado. Em geral, os valores normalizados são mais úteis à medida que o número de atributos de um caso aumenta e as diferenças entre as probabilidades brutas de quaisquer dois casos tornam-se muito menores.
A seguinte equação é usada para calcular os valores normalizados, determinados x e y:
x = probabilidade do caso baseada no modelo de cluster
y = probabilidade de caso marginal, calculada como a probabilidade de log do caso com base na contagem dos casos de treinamento
Z = Exp( log(x) – Log(Y))
Normalizado = (z/ (1+z))
Exemplos
O exemplo a seguir retorna a probabilidade de o caso específico ocorrer no modelo de cluster, que é baseado no banco de dados Adventure Works DW.
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
Resultados esperados:
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6.30672792729321E-08 |
6.30672792729321E-08 |
9.5824454056846E-48 |
A diferença entre esses resultados demonstra o efeito da normalização. O valor bruto para CaseLikelihood sugere que a probabilidade do caso é aproximadamente 20 por cento; entretanto, quando você normaliza os resultados, torna-se aparente que a probabilidade do caso é muito baixa.
Consulte também
Referência
Referência de função de DMX (Data Mining Extensions)
Funções de previsão gerais (DMX)
Conceitos
Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)