Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Resumen de un modelo de Microsoft R Machine Learning.
Uso
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argumentos
object
Objeto de modelo devuelto por un análisis de MicrosoftML .
top
Especifica el recuento de coeficientes superiores que se van a mostrar en el resumen de los modelos lineales, como rxLogisticRegression y rxFastLinear. El sesgo aparece primero, seguido de otros pesos, ordenados por sus valores absolutos en orden descendente. Si se establece en NULL
, se muestran todos los coeficientes distintos de cero. De lo contrario, solo se muestran los primeros top
coeficientes.
...
Argumentos adicionales que se van a pasar al método de resumen.
Detalles
Proporciona información de resumen sobre la llamada de función original, la
conjunto de datos usado para entrenar el modelo y estadísticas de coeficientes en el modelo.
Importancia
El summary
método de los objetos de análisis de MicrosoftML devuelve una lista que incluye la llamada de función original y los parámetros subyacentes usados. El coef
método devuelve un vector con nombre de pesos y procesa información del objeto de modelo.
Para rxLogisticRegression, las siguientes estadísticas también pueden aparecer en el resumen cuando showTrainingStats
se establece TRUE
en .
training.size
Tamaño, en términos de recuento de filas, del conjunto de datos usado para entrenar el modelo.
deviance
La desviación del modelo se da cuando -2 * ln(L)
L
es la probabilidad de obtener las observaciones con todas las características incorporadas en el modelo.
null.deviance
La desviación nula es dada por -2 * ln(L0)
donde L0
es la probabilidad de obtener las observaciones sin ningún efecto de las características. El modelo null incluye el sesgo si hay uno en el modelo.
aic
El AIC (criterio de información de Akaike) se define como 2 * k ``+ deviance
, donde k
es el número de coeficientes del modelo. El sesgo cuenta como uno de los coeficientes. El AIC es una medida de la calidad relativa del modelo. Se ocupa del equilibrio entre la bondad del ajuste del modelo (medido por desviación) y la complejidad del modelo (medido por el número de coeficientes).
coefficients.stats
Se trata de una trama de datos que contiene las estadísticas de cada coeficiente del modelo. Para cada coeficiente, se muestran las siguientes estadísticas. El sesgo aparece en la primera fila y los coeficientes restantes en el orden ascendente de p-value.
- EstimaciónEl valor de coeficiente estimado del modelo.
- Error stdEste es la raíz cuadrada de la varianza de muestra grande de la estimación del coeficiente.
- z-ScoreWe puede probar con la hipótesis nula, que indica que el coeficiente debe ser cero, con respecto a la importancia del coeficiente calculando la relación de su estimación y su error estándar. En la hipótesis nula, si no se aplica ninguna regularización, la estimación del coeficiente relativo sigue una distribución normal con una media 0 y una desviación estándar igual al error estándar calculado anteriormente. La puntuación z genera la relación entre la estimación de un coeficiente y el error estándar del coeficiente.
- Pr(>|z|) Este es el valor p correspondiente para la prueba de dos lados de la puntuación z. En función del nivel de importancia, se anexa un indicador de importancia al valor p. Si
F(x)
es el CDF de la distribuciónN(0, 1)
normal estándar , .P(>|z|) = 2 - ``2 * F(|z|)
Autor(es)
Microsoft Corporation Microsoft Technical Support
Consulte también
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Ejemplos
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]