Partilhar via


summary.mlModel: Resumo de um modelo de Aprendizado de Máquina do Microsoft R.

Resumo de um modelo de Microsoft R Machine Learning.

Utilização

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Argumentos

object

Um objeto de modelo retornado de uma análise MicrosoftML .

top

Especifica a contagem de coeficientes superiores a serem mostrados no resumo para modelos lineares como rxLogisticRegression e rxFastLinear. O viés aparece primeiro, seguido por outros pesos, ordenados por seus valores absolutos em ordem decrescente. Se definido como NULL, todos os coeficientes diferentes de zero são mostrados. Caso contrário, apenas os primeiros top coeficientes são mostrados.

...

Argumentos adicionais a serem passados para o método de resumo.

Detalhes

Fornece informações resumidas sobre a chamada de função original, o
conjunto de dados usado para treinar o modelo e estatísticas para coeficientes no modelo.

Valor

O summary método dos objetos de análise MicrosoftML retorna uma lista que inclui a chamada de função original e os parâmetros subjacentes usados. O coef método retorna um vetor nomeado de pesos, processando informações do objeto de modelo.

Para rxLogisticRegression, as estatísticas a seguir também podem ser apresentadas no resumo quando showTrainingStats definido como TRUE.

training.size

O tamanho, em termos de contagem de linhas, do conjunto de dados usado para treinar o modelo.

deviance

O desvio do modelo é dado por -2 * ln(L) onde L está a probabilidade de obter as observações com todas as características incorporadas no modelo.

null.deviance

O desvio nulo é dado por -2 * ln(L0) onde L0 está a probabilidade de obter as observações sem efeito das características. O modelo nulo inclui o viés se houver um no modelo.

aic

O AIC (Akaike Information Criterion) é definido como 2 * k ``+ deviance, onde k é o número de coeficientes do modelo. O viés conta como um dos coeficientes. O CIA é uma medida da qualidade relativa do modelo. Trata do trade-off entre a bondade do ajuste do modelo (medida pelo desvio) e a complexidade do modelo (medida pelo número de coeficientes).

coefficients.stats

Este é um quadro de dados que contém as estatísticas para cada coeficiente no modelo. Para cada coeficiente, são apresentadas as seguintes estatísticas. O viés aparece na primeira linha, e os coeficientes restantes na ordem crescente do valor p.

  • EstimativaO valor estimado do coeficiente do modelo.
  • Std ErrorEsta é a raiz quadrada da variância de amostra grande da estimativa do coeficiente.
  • z-ScorePodemos testar contra a hipótese nula, que afirma que o coeficiente deve ser zero, no que diz respeito à significância do coeficiente calculando a razão entre sua estimativa e seu erro padrão. Na hipótese nula, se não houver regularização aplicada, a estimativa do coeficiente referente segue uma distribuição normal com média 0 e desvio padrão igual ao erro padrão computado acima. O z-score produz a razão entre a estimativa de um coeficiente e o erro padrão do coeficiente.
  • Pr(>|z|) Este é o valor p correspondente para o teste de dois lados do z-score. Com base no nível de significância, um indicador de significância é anexado ao valor p. Se F(x) é o CDF da distribuição N(0, 1)normal padrão , então P(>|z|) = 2 - ``2 * F(|z|).

Autor(es)

Corporação Microsoft Microsoft Technical Support

Ver também

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Exemplos


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]