summary.mlModel: resumo de um modelo de Machine Learning do Microsoft R.
Resumo de um modelo de Machine Learning do Microsoft R.
Uso
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argumentos
object
Um objeto de modelo retornado de uma análise do MicrosoftML.
top
Especifica a contagem de coeficientes principais a mostrar no resumo para modelos lineares, como rxLogisticRegression e rxFastLinear. O desvio aparece primeiro, seguido por outros pesos, classificado por seus valores absolutos em ordem decrescente. Se definido como NULL
, todos os coeficientes diferentes de zero serão mostrados. Caso contrário, somente os top
primeiros coeficientes serão mostrados.
...
Argumentos adicionais a serem transmitidos para o método de resumo.
Detalhes
Fornece informações resumidas sobre a chamada de função original, o
conjunto de dados usado para treinar o modelo e estatísticas para coeficientes no modelo.
Valor
O método summary
dos objetos de análise do MicrosoftML retorna uma lista que inclui a chamada de função original e os parâmetros subjacentes usados. O método coef
retorna um vetor de pesos nomeado, processando informações do objeto de modelo.
Para rxLogisticRegression, as estatísticas a seguir também podem estar presentes no resumo quando showTrainingStats
é definido como TRUE
.
training.size
O tamanho, em termos de contagem de linhas, do conjunto de dados usado para treinar o modelo.
deviance
O desvio de modelo é fornecido por -2 * ln(L)
em que L
é a probabilidade de obter as observações com todos os recursos incorporados no modelo.
null.deviance
O desvio nulo é fornecido por -2 * ln(L0)
em que L0
é a probabilidade de obter as observações sem efeitos dos recursos. O modelo nulo incluirá o desvio se houver um no modelo.
aic
O AIC (critério de informações do Akaike) é definido como 2 * k ``+ deviance
, em que k
é o número de coeficientes do modelo. O desvio conta como um dos coeficientes. O AIC é uma medida da qualidade relativa do modelo. Ele lida com a compensação entre a qualidade de adequação do modelo (medida por desvio) e a complexidade do modelo (medida pelo número de coeficientes).
coefficients.stats
Essa é uma estrutura de dados que contém as estatísticas de cada coeficiente no modelo. Para cada coeficiente, as estatísticas a seguir são mostradas. O desvio aparece na primeira linha, e os coeficientes restantes na ordem crescente de valor-P.
- Estimate O valor estimado do coeficiente do modelo.
- Std Error A raiz quadrada da variação de amostra grande da estimativa do coeficiente.
- z-Score Podemos testar em relação à hipótese nula, que declara que o coeficiente deve ser zero, com relação à significância do coeficiente calculando a proporção de sua estimativa e seu erro padrão. Sob a hipótese nula, se não houver nenhuma regularização aplicada, a estimativa do coeficiente relacionado seguirá uma distribuição normal com média 0 e um desvio padrão igual ao erro padrão calculado acima. A pontuação z gera a proporção entre a estimativa de um coeficiente e o erro padrão do coeficiente.
- Pr(>|z|) Esse é o valor-P correspondente para o teste de dois lados da pontuação z. Com base no nível de significância, um indicador de significância é anexado ao valor-P. Se
F(x)
for o CDF da distribuição normal padrãoN(0, 1)
, entãoP(>|z|) = 2 - ``2 * F(|z|)
.
Autor(es)
Microsoft Corporation Microsoft Technical Support
Confira também
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Exemplos
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]