PredictCaseLikelihood (DMX)

Artículo
05/08/2013

Esta función devuelve la probabilidad de que un caso de entrada vaya a caber en el modelo existente. Se utiliza solo con modelos de agrupación en clústeres.

Sintaxis

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

Argumentos

NORMALIZED
El valor devuelto contiene la probabilidad del caso dentro modelo dividida por la probabilidad del caso sin el modelo.
NONNORMALIZED
El valor devuelto contiene la probabilidad sin procesar del caso, que es el producto de las probabilidades de los atributos del caso.

Se aplica a

Modelos generados con los algoritmos de clústeres deMicrosoft y de agrupación en clústeres de secuencia de Microsoft.

Tipo devuelto

Número de punto flotante de doble precisión entre 0 y 1. Un número más cercano a 1 indica que el caso tiene mayor probabilidad de producirse en este modelo. Un número más cercano a 0 indica que es menos probable que se produzca el caso en este modelo.

Comentarios

El resultado de la función PredictCaseLikelihood se normaliza de forma predeterminada. Los valores normalizados son generalmente más útiles cuando aumenta el número de atributos de un caso y las diferencias entre las probabilidades sin procesar de dos casos cualesquiera se hacen mucho menores.

La ecuación siguiente se utiliza para calcular los valores normalizados a partir de los valores de x e y dados:

x = probabilidad del caso basada en el modelo de agrupación en clústeres
y = probabilidad marginal del caso, calculada como el logaritmo de la probabilidad del caso basada en contar los casos de entrenamiento
Z = Exp( log(x) – Log(Y))

Normalized = (z/ (1+z))

Ejemplos

El ejemplo siguiente devuelve la probabilidad de que el caso especificado se produzca dentro del modelo de agrupación en clústeres, que se basa en la base de datos Adventure Works de DW.

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

Resultados esperados:

Default_Likelihood	Normalized_Likelihood	Raw_Likelihood
6,30672792729321E-08	6,30672792729321E-08	9,5824454056846E-48

La diferencia entre estos resultados demuestra el efecto de la normalización. El valor sin procesar de CaseLikelihood sugiere que la probabilidad del caso es de un 20 por ciento aproximadamente. Sin embargo, al normalizar los resultados, se ve claramente que la probabilidad del caso es muy baja.