PredictCaseLikelihood (DMX)
Questa funzione restituisce la probabilità che un case di input risulti adatto al modello esistente. Utilizzata solo con i modelli di tipo clustering.
Sintassi
PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])
Argomenti
NORMALIZED
Il valore restituito contiene la probabilità del case nel modello diviso per la probabilità del case senza il modello.NONNORMALIZED
Il valore restituito contiene la probabilità non elaborata del case, che rappresenta il prodotto delle probabilità degli attributi del case.
Si applica a
Modelli compilati utilizzando gli algoritmi Microsoft Clustering e Microsoft Sequence Clustering.
Tipo restituito
Numero a virgola mobile a precisione doppia compreso tra 0 e 1. Un numero più vicino a 1 indica che il case ha una maggiore probabilità di essere presente nel modello. Un numero più vicino a 0 indica che il case ha una minore probabilità di essere presente nel modello.
Osservazioni
Per impostazione predefinita, il risultato della funzione PredictCaseLikelihood è normalizzato. I valori normalizzati sono in genere più utili come numero di attributi in un aumento del case e le differenze tra le probabilità non elaborate di uno dei due case si riducono notevolmente.
L'equazione seguente viene utilizzata per calcolare i valori normalizzati, dati x e y:
x = probabilità del case in base al modello di clustering
y = probabilità marginale del case, calcolata come la probabilità in forma logaritmica del case in base al conteggio dei case di training
Z = Exp( log(x) – Log(Y))
Normalizzazione = (z/ (1+z))
Esempi
Nell'esempio seguente viene restituita la probabilità che il case specificato si presenti nel modello di clustering, basato sul database Adventure Works DW.
SELECT
PredictCaseLikelihood() AS Default_Likelihood,
PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
[TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
'2-5 Miles' AS [Commute Distance],
'Graduate Degree' AS [Education],
0 AS [Number Cars Owned],
0 AS [Number Children At Home]) AS t
Risultati previsti:
Default_Likelihood |
Normalized_Likelihood |
Raw_Likelihood |
---|---|---|
6.30672792729321E-08 |
6.30672792729321E-08 |
9.5824454056846E-48 |
La differenza tra questi risultati dimostra l'effetto della normalizzazione. Il valore non elaborato per CaseLikelihood indica che la probabilità del case è pari a circa il 20%. Quando si normalizzano i risultati, diviene tuttavia evidente che la probabilità del case è molto bassa.