summary.mlModel: riepilogo di un modello di Machine Learning di Microsoft R.
Riepilogo di un modello di Machine Learning di Microsoft R.
Utilizzo
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Arguments
object
Oggetto modello restituito da un'analisi MicrosoftML.
top
Specifica il conteggio dei coefficienti principali da visualizzare nel riepilogo dei modelli lineari, ad esempio rxLogisticRegression e rxFastLinear. La distorsione appare prima, seguita da altri pesi, ordinati in base ai valori assoluti in ordine decrescente. Se impostato su NULL
, vengono visualizzati tutti i coefficienti non zero. In caso contrario, vengono visualizzati solo i primi top
coefficienti.
...
Argomenti aggiuntivi da passare al metodo di riepilogo.
Dettagli
Fornisce informazioni di riepilogo sulla chiamata alla funzione originale,
il set di dati usato per eseguire il training del modello e le statistiche per i coefficienti del modello.
Valore
Il metodo summary
degli oggetti di analisi MicrosoftML restituisce un elenco che include la chiamata alla funzione originale e i parametri sottostanti usati. Il metodo coef
restituisce un vettore denominato di pesi che elabora le informazioni dall'oggetto modello.
Per rxLogisticRegression, possono essere presenti nel riepilogo anche le statistiche seguenti quando showTrainingStats
è impostato su TRUE
.
training.size
Dimensioni, in termini di conteggio delle righe, del set di dati usato per eseguire il training del modello.
deviance
La devianza del modello viene data da -2 * ln(L)
, dove L
è la probabilità di ottenere le osservazioni con tutte le funzionalità incorporate nel modello.
null.deviance
La devianza null viene data da -2 * ln(L0)
, dove L0
è la probabilità di ottenere le osservazioni senza effetto dalle caratteristiche. Il modello null include la distorsione, se ne esiste una nel modello.
aic
L'AIC (Akaike Information Criterion) è definito come 2 * k ``+ deviance
, dove k
è il numero di coefficienti del modello. La distorsione conta come uno dei coefficienti. L'AIC è una misura della qualità relativa del modello. Si occupa del compromesso tra la bontà del modello (misurata dalla devianza) e la complessità del modello (misurata dal numero di coefficienti).
coefficients.stats
Si tratta di un frame di dati contenente le statistiche per ogni coefficiente nel modello. Per ogni coefficiente vengono visualizzate le statistiche seguenti. La distorsione viene visualizzata nella prima riga e i coefficienti rimanenti nell'ordine crescente di valore p.
- Stima Il valore stimato del coefficiente del modello.
- Errore standard È la radice quadrata della varianza di campione di grandi dimensioni della stima del coefficiente.
- z-Score È possibile testare l'ipotesi null, che indica che il coefficiente deve essere zero, in merito al significato del coefficiente calcolando il rapporto della stima e del relativo errore standard. Nell'ipotesi null, se non è applicata alcuna regolarizzazione, la stima del coefficiente relativo segue una distribuzione normale con media 0 e una deviazione standard uguale all'errore standard calcolato sopra. Il punteggio z restituisce il rapporto tra la stima di un coefficiente e l'errore standard del coefficiente.
- Pr(>|z|) Si tratta del valore p corrispondente per il test a due code del punteggio z. In base al livello di importanza, un indicatore di significance viene aggiunto al valore p. Se
F(x)
è il CDF della distribuzione normale standardN(0, 1)
,P(>|z|) = 2 - ``2 * F(|z|)
.
Autore/i
Microsoft Corporation Microsoft Technical Support
Vedi anche
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Esempi
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]