Condividi tramite


PredictCaseLikelihood (DMX)

Questa funzione restituisce la probabilità che un case di input risulti adatto al modello esistente. Utilizzata solo con i modelli di tipo clustering.

Sintassi

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

Argomenti

  • NORMALIZED
    Il valore restituito contiene la probabilità del case nel modello diviso per la probabilità del case senza il modello.

  • NONNORMALIZED
    Il valore restituito contiene la probabilità non elaborata del case, che rappresenta il prodotto delle probabilità degli attributi del case.

Si applica a

Modelli compilati utilizzando gli algoritmi Microsoft Clustering e Microsoft Sequence Clustering.

Tipo restituito

Numero a virgola mobile a precisione doppia compreso tra 0 e 1. Un numero più vicino a 1 indica che il case ha una maggiore probabilità di essere presente nel modello. Un numero più vicino a 0 indica che il case ha una minore probabilità di essere presente nel modello.

Osservazioni

Per impostazione predefinita, il risultato della funzione PredictCaseLikelihood è normalizzato. I valori normalizzati sono in genere più utili come numero di attributi in un aumento del case e le differenze tra le probabilità non elaborate di uno dei due case si riducono notevolmente.

L'equazione seguente viene utilizzata per calcolare i valori normalizzati, dati x e y:

  • x = probabilità del case in base al modello di clustering

  • y = probabilità marginale del case, calcolata come la probabilità in forma logaritmica del case in base al conteggio dei case di training

  • Z = Exp( log(x) – Log(Y))

Normalizzazione = (z/ (1+z))

Esempi

Nell'esempio seguente viene restituita la probabilità che il case specificato si presenti nel modello di clustering, basato sul database Adventure Works DW.

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

Risultati previsti:

Default_Likelihood

Normalized_Likelihood

Raw_Likelihood

6.30672792729321E-08

6.30672792729321E-08

9.5824454056846E-48

La differenza tra questi risultati dimostra l'effetto della normalizzazione. Il valore non elaborato per CaseLikelihood indica che la probabilità del case è pari a circa il 20%. Quando si normalizzano i risultati, diviene tuttavia evidente che la probabilità del case è molto bassa.