PredictCaseLikelihood (DMX)
Esta función devuelve la probabilidad de que un caso de entrada vaya a caber en el modelo existente. Se utiliza solo con modelos de agrupación en clústeres.
Sintaxis
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
Argumentos
NORMALIZED
El valor devuelto contiene la probabilidad del caso dentro modelo dividida por la probabilidad del caso sin el modelo.NONNORMALIZED
El valor devuelto contiene la probabilidad sin procesar del caso, que es el producto de las probabilidades de los atributos del caso.
Se aplica a
Modelos generados con los algoritmos de clústeres deMicrosoft y de agrupación en clústeres de secuencia de Microsoft.
Tipo devuelto
Número de punto flotante de doble precisión entre 0 y 1. Un número más cercano a 1 indica que el caso tiene mayor probabilidad de producirse en este modelo. Un número más cercano a 0 indica que es menos probable que se produzca el caso en este modelo.
Comentarios
El resultado de la función PredictCaseLikelihood se normaliza de forma predeterminada. Los valores normalizados son generalmente más útiles cuando aumenta el número de atributos de un caso y las diferencias entre las probabilidades sin procesar de dos casos cualesquiera se hacen mucho menores.
La ecuación siguiente se utiliza para calcular los valores normalizados a partir de los valores de x e y dados:
x = probabilidad del caso basada en el modelo de agrupación en clústeres
y = probabilidad marginal del caso, calculada como el logaritmo de la probabilidad del caso basada en contar los casos de entrenamiento
Z = Exp( log(x) – Log(Y))
Normalized = (z/ (1+z))
Ejemplos
El ejemplo siguiente devuelve la probabilidad de que el caso especificado se produzca dentro del modelo de agrupación en clústeres, que se basa en la base de datos Adventure Works de DW.
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
Resultados esperados:
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6,30672792729321E-08 |
6,30672792729321E-08 |
9,5824454056846E-48 |
La diferencia entre estos resultados demuestra el efecto de la normalización. El valor sin procesar de CaseLikelihood sugiere que la probabilidad del caso es de un 20 por ciento aproximadamente. Sin embargo, al normalizar los resultados, se ve claramente que la probabilidad del caso es muy baja.
Vea también
Referencia
Referencia de funciones de Extensiones de minería de datos (DMX)
Funciones de predicción generales (DMX)
Conceptos
Algoritmos de minería de datos (Analysis Services: Minería de datos)