Compartir a través de


summary.mlModel: resumen de un modelo de Microsoft R Machine Learning.

Resumen de un modelo de Microsoft R Machine Learning.

Uso

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Argumentos

object

Objeto de modelo devuelto por un análisis de MicrosoftML .

top

Especifica el recuento de coeficientes superiores que se van a mostrar en el resumen de los modelos lineales, como rxLogisticRegression y rxFastLinear. El sesgo aparece primero, seguido de otros pesos, ordenados por sus valores absolutos en orden descendente. Si se establece en NULL, se muestran todos los coeficientes distintos de cero. De lo contrario, solo se muestran los primeros top coeficientes.

...

Argumentos adicionales que se van a pasar al método de resumen.

Detalles

Proporciona información de resumen sobre la llamada de función original, la
conjunto de datos usado para entrenar el modelo y estadísticas de coeficientes en el modelo.

Importancia

El summary método de los objetos de análisis de MicrosoftML devuelve una lista que incluye la llamada de función original y los parámetros subyacentes usados. El coef método devuelve un vector con nombre de pesos y procesa información del objeto de modelo.

Para rxLogisticRegression, las siguientes estadísticas también pueden aparecer en el resumen cuando showTrainingStats se establece TRUEen .

training.size

Tamaño, en términos de recuento de filas, del conjunto de datos usado para entrenar el modelo.

deviance

La desviación del modelo se da cuando -2 * ln(L)L es la probabilidad de obtener las observaciones con todas las características incorporadas en el modelo.

null.deviance

La desviación nula es dada por -2 * ln(L0) donde L0 es la probabilidad de obtener las observaciones sin ningún efecto de las características. El modelo null incluye el sesgo si hay uno en el modelo.

aic

El AIC (criterio de información de Akaike) se define como 2 * k ``+ deviance, donde k es el número de coeficientes del modelo. El sesgo cuenta como uno de los coeficientes. El AIC es una medida de la calidad relativa del modelo. Se ocupa del equilibrio entre la bondad del ajuste del modelo (medido por desviación) y la complejidad del modelo (medido por el número de coeficientes).

coefficients.stats

Se trata de una trama de datos que contiene las estadísticas de cada coeficiente del modelo. Para cada coeficiente, se muestran las siguientes estadísticas. El sesgo aparece en la primera fila y los coeficientes restantes en el orden ascendente de p-value.

  • EstimaciónEl valor de coeficiente estimado del modelo.
  • Error stdEste es la raíz cuadrada de la varianza de muestra grande de la estimación del coeficiente.
  • z-ScoreWe puede probar con la hipótesis nula, que indica que el coeficiente debe ser cero, con respecto a la importancia del coeficiente calculando la relación de su estimación y su error estándar. En la hipótesis nula, si no se aplica ninguna regularización, la estimación del coeficiente relativo sigue una distribución normal con una media 0 y una desviación estándar igual al error estándar calculado anteriormente. La puntuación z genera la relación entre la estimación de un coeficiente y el error estándar del coeficiente.
  • Pr(>|z|) Este es el valor p correspondiente para la prueba de dos lados de la puntuación z. En función del nivel de importancia, se anexa un indicador de importancia al valor p. Si F(x) es el CDF de la distribución N(0, 1)normal estándar , .P(>|z|) = 2 - ``2 * F(|z|)

Autor(es)

Microsoft Corporation Microsoft Technical Support

Consulte también

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Ejemplos


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]