Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Resumo de um modelo de Microsoft R Machine Learning.
Utilização
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argumentos
object
Um objeto de modelo retornado de uma análise MicrosoftML .
top
Especifica a contagem de coeficientes superiores a serem mostrados no resumo para modelos lineares como rxLogisticRegression e rxFastLinear. O viés aparece primeiro, seguido por outros pesos, ordenados por seus valores absolutos em ordem decrescente. Se definido como NULL
, todos os coeficientes diferentes de zero são mostrados. Caso contrário, apenas os primeiros top
coeficientes são mostrados.
...
Argumentos adicionais a serem passados para o método de resumo.
Detalhes
Fornece informações resumidas sobre a chamada de função original, o
conjunto de dados usado para treinar o modelo e estatísticas para coeficientes no modelo.
Valor
O summary
método dos objetos de análise MicrosoftML retorna uma lista que inclui a chamada de função original e os parâmetros subjacentes usados. O coef
método retorna um vetor nomeado de pesos, processando informações do objeto de modelo.
Para rxLogisticRegression, as estatísticas a seguir também podem ser apresentadas no resumo quando showTrainingStats
definido como TRUE
.
training.size
O tamanho, em termos de contagem de linhas, do conjunto de dados usado para treinar o modelo.
deviance
O desvio do modelo é dado por -2 * ln(L)
onde L
está a probabilidade de obter as observações com todas as características incorporadas no modelo.
null.deviance
O desvio nulo é dado por -2 * ln(L0)
onde L0
está a probabilidade de obter as observações sem efeito das características. O modelo nulo inclui o viés se houver um no modelo.
aic
O AIC (Akaike Information Criterion) é definido como 2 * k ``+ deviance
, onde k
é o número de coeficientes do modelo. O viés conta como um dos coeficientes. O CIA é uma medida da qualidade relativa do modelo. Trata do trade-off entre a bondade do ajuste do modelo (medida pelo desvio) e a complexidade do modelo (medida pelo número de coeficientes).
coefficients.stats
Este é um quadro de dados que contém as estatísticas para cada coeficiente no modelo. Para cada coeficiente, são apresentadas as seguintes estatísticas. O viés aparece na primeira linha, e os coeficientes restantes na ordem crescente do valor p.
- EstimativaO valor estimado do coeficiente do modelo.
- Std ErrorEsta é a raiz quadrada da variância de amostra grande da estimativa do coeficiente.
- z-ScorePodemos testar contra a hipótese nula, que afirma que o coeficiente deve ser zero, no que diz respeito à significância do coeficiente calculando a razão entre sua estimativa e seu erro padrão. Na hipótese nula, se não houver regularização aplicada, a estimativa do coeficiente referente segue uma distribuição normal com média 0 e desvio padrão igual ao erro padrão computado acima. O z-score produz a razão entre a estimativa de um coeficiente e o erro padrão do coeficiente.
- Pr(>|z|) Este é o valor p correspondente para o teste de dois lados do z-score. Com base no nível de significância, um indicador de significância é anexado ao valor p. Se
F(x)
é o CDF da distribuiçãoN(0, 1)
normal padrão , entãoP(>|z|) = 2 - ``2 * F(|z|)
.
Autor(es)
Corporação Microsoft Microsoft Technical Support
Ver também
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Exemplos
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]