Compartir a través de


PredictCaseLikelihood (DMX)

Se utiliza solo con modelos de agrupación en clústeres. Esta función devuelve la probabilidad de que un caso de entrada vaya a caber en el modelo existente.

Sintaxis

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

Argumentos

  • NORMALIZED
    El valor devuelto contiene la probabilidad del caso dentro modelo dividida por la probabilidad del caso sin el modelo.

  • NONNORMALIZED
    El valor devuelto contiene la probabilidad sin procesar del caso, que es el producto de las probabilidades de los atributos del caso.

Se aplica a

Modelos generados con los algoritmos de clústeres y de clústeres de secuencia de Microsoft.

Tipo devuelto

Número de punto flotante de doble precisión entre 0 y 1. Un número más cercano a 1 indica que el caso tiene mayor probabilidad de producirse en este modelo. Un número más cercano a 0 indica que es menos probable que se produzca el caso en este modelo.

Notas

El resultado de la función PredictCaseLikelihood se normaliza de forma predeterminada. Los valores normalizados son generalmente más útiles cuando aumenta el número de atributos de un caso y las diferencias entre las probabilidades sin procesar de dos casos cualesquiera se hacen mucho menores.

La ecuación siguiente se utiliza para calcular los valores normalizados a partir de los valores de x e y dados:

  • x = probabilidad del caso basada en el modelo de agrupación en clústeres

  • y = probabilidad marginal del caso, calculada como el logaritmo de la probabilidad del caso basada en contar los casos de entrenamiento

  • Z = Exp( log(x) – Log(Y))

Normalizado = (z/ (1+z))

Ejemplos

El ejemplo siguiente devuelve la probabilidad de que el caso especificado se produzca dentro del modelo de agrupación en clústeres que se creó en Tutorial básico de minería de datos.

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

Resultados esperados:

Default_Likelihood

Normalized_Likelihood

Raw_Likelihood

6,30672792729321E-08

6,30672792729321E-08

9,5824454056846E-48

La diferencia entre estos resultados demuestra el efecto de la normalización.

Historial de cambios

Contenido actualizado

Se ha corregido el ejemplo para mostrar con precisión las diferencias entre las probabilidades predeterminada, normalizada y sin normalizar (bruta).