Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Resumo de um modelo do Microsoft R Machine Learning.
Uso
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argumentos
object
Um objeto de modelo retornado de uma análise do MicrosoftML .
top
Especifica a contagem de coeficientes principais a serem mostrados no resumo de modelos lineares, como rxLogisticRegression e rxFastLinear. O viés aparece primeiro, seguido por outros pesos, classificados por seus valores absolutos em ordem decrescente. Se definido como NULL
, todos os coeficientes não zero serão mostrados. Caso contrário, somente os primeiros top
coeficientes serão mostrados.
...
Argumentos adicionais a serem passados para o método de resumo.
Detalhes
Fornece informações resumidas sobre a chamada de função original, o
conjunto de dados usado para treinar o modelo e estatísticas para coeficientes no modelo.
Valor
O summary
método dos objetos de análise MicrosoftML retorna uma lista que inclui a chamada de função original e os parâmetros subjacentes usados. O coef
método retorna um vetor nomeado de pesos, processando informações do objeto modelo.
Para rxLogisticRegression, as estatísticas a seguir também podem estar presentes no resumo quando showTrainingStats
definidas como TRUE
.
training.size
O tamanho, em termos de contagem de linhas, do conjunto de dados usado para treinar o modelo.
deviance
O desvio de modelo é dado por -2 * ln(L)
onde L
está a probabilidade de obter as observações com todos os recursos incorporados no modelo.
null.deviance
O desvio nulo é dado por -2 * ln(L0)
onde L0
está a probabilidade de obter as observações sem efeito dos recursos. O modelo nulo inclui o viés se houver um no modelo.
aic
O AIC (Critério de Informações do Akaike) é definido como 2 * k ``+ deviance
, onde k
está o número de coeficientes do modelo. O viés conta como um dos coeficientes. O AIC é uma medida da qualidade relativa do modelo. Trata da compensação entre a bondade do ajuste do modelo (medido por desvio) e a complexidade do modelo (medido pelo número de coeficientes).
coefficients.stats
Esse é um quadro de dados que contém as estatísticas de cada coeficiente no modelo. Para cada coeficiente, as estatísticas a seguir são mostradas. O viés aparece na primeira linha e os coeficientes restantes na ordem crescente de p-value.
- Estimar o valor de coeficiente estimado do modelo.
- Std ErrorThis é a raiz quadrada da variação de amostra grande da estimativa do coeficiente.
- z-ScoreWe pode testar a hipótese nula, que afirma que o coeficiente deve ser zero, em relação à significância do coeficiente calculando a taxa de sua estimativa e seu erro padrão. Na hipótese nula, se não houver nenhuma regularização aplicada, a estimativa do coeficiente preocupante seguirá uma distribuição normal com média 0 e um desvio padrão igual ao erro padrão calculado acima. A pontuação z gera a taxa entre a estimativa de um coeficiente e o erro padrão do coeficiente.
- Pr(>|z|) Esse é o valor p correspondente para o teste de dois lados da pontuação z. Com base no nível de significância, um indicador de significância é acrescentado ao valor p. Se
F(x)
for o CDF da distribuiçãoN(0, 1)
normal padrão, entãoP(>|z|) = 2 - ``2 * F(|z|)
.
Autor(s)
Microsoft Corporation Microsoft Technical Support
Consulte também
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Exemplos
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]