Condividi tramite


summary.mlModel: riepilogo di un modello di Machine Learning di Microsoft R.

Riepilogo di un modello di Machine Learning di Microsoft R.

Utilizzo

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Arguments

object

Oggetto modello restituito da un'analisi MicrosoftML.

top

Specifica il conteggio dei coefficienti principali da visualizzare nel riepilogo dei modelli lineari, ad esempio rxLogisticRegression e rxFastLinear. La distorsione appare prima, seguita da altri pesi, ordinati in base ai valori assoluti in ordine decrescente. Se impostato su NULL, vengono visualizzati tutti i coefficienti non zero. In caso contrario, vengono visualizzati solo i primi top coefficienti.

...

Argomenti aggiuntivi da passare al metodo di riepilogo.

Dettagli

Fornisce informazioni di riepilogo sulla chiamata alla funzione originale,
il set di dati usato per eseguire il training del modello e le statistiche per i coefficienti del modello.

Valore

Il metodo summary degli oggetti di analisi MicrosoftML restituisce un elenco che include la chiamata alla funzione originale e i parametri sottostanti usati. Il metodo coef restituisce un vettore denominato di pesi che elabora le informazioni dall'oggetto modello.

Per rxLogisticRegression, possono essere presenti nel riepilogo anche le statistiche seguenti quando showTrainingStats è impostato su TRUE.

training.size

Dimensioni, in termini di conteggio delle righe, del set di dati usato per eseguire il training del modello.

deviance

La devianza del modello viene data da -2 * ln(L), dove L è la probabilità di ottenere le osservazioni con tutte le funzionalità incorporate nel modello.

null.deviance

La devianza null viene data da -2 * ln(L0), dove L0 è la probabilità di ottenere le osservazioni senza effetto dalle caratteristiche. Il modello null include la distorsione, se ne esiste una nel modello.

aic

L'AIC (Akaike Information Criterion) è definito come 2 * k ``+ deviance, dove k è il numero di coefficienti del modello. La distorsione conta come uno dei coefficienti. L'AIC è una misura della qualità relativa del modello. Si occupa del compromesso tra la bontà del modello (misurata dalla devianza) e la complessità del modello (misurata dal numero di coefficienti).

coefficients.stats

Si tratta di un frame di dati contenente le statistiche per ogni coefficiente nel modello. Per ogni coefficiente vengono visualizzate le statistiche seguenti. La distorsione viene visualizzata nella prima riga e i coefficienti rimanenti nell'ordine crescente di valore p.

  • Stima Il valore stimato del coefficiente del modello.
  • Errore standard È la radice quadrata della varianza di campione di grandi dimensioni della stima del coefficiente.
  • z-Score È possibile testare l'ipotesi null, che indica che il coefficiente deve essere zero, in merito al significato del coefficiente calcolando il rapporto della stima e del relativo errore standard. Nell'ipotesi null, se non è applicata alcuna regolarizzazione, la stima del coefficiente relativo segue una distribuzione normale con media 0 e una deviazione standard uguale all'errore standard calcolato sopra. Il punteggio z restituisce il rapporto tra la stima di un coefficiente e l'errore standard del coefficiente.
  • Pr(>|z|) Si tratta del valore p corrispondente per il test a due code del punteggio z. In base al livello di importanza, un indicatore di significance viene aggiunto al valore p. Se F(x) è il CDF della distribuzione normale standard N(0, 1), P(>|z|) = 2 - ``2 * F(|z|).

Autore/i

Microsoft Corporation Microsoft Technical Support

Vedi anche

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Esempi


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]