Compartilhar via


summary.mlModel: resumo de um modelo do Microsoft R Machine Learning.

Resumo de um modelo do Microsoft R Machine Learning.

Uso

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Argumentos

object

Um objeto de modelo retornado de uma análise do MicrosoftML .

top

Especifica a contagem de coeficientes principais a serem mostrados no resumo de modelos lineares, como rxLogisticRegression e rxFastLinear. O viés aparece primeiro, seguido por outros pesos, classificados por seus valores absolutos em ordem decrescente. Se definido como NULL, todos os coeficientes não zero serão mostrados. Caso contrário, somente os primeiros top coeficientes serão mostrados.

...

Argumentos adicionais a serem passados para o método de resumo.

Detalhes

Fornece informações resumidas sobre a chamada de função original, o
conjunto de dados usado para treinar o modelo e estatísticas para coeficientes no modelo.

Valor

O summary método dos objetos de análise MicrosoftML retorna uma lista que inclui a chamada de função original e os parâmetros subjacentes usados. O coef método retorna um vetor nomeado de pesos, processando informações do objeto modelo.

Para rxLogisticRegression, as estatísticas a seguir também podem estar presentes no resumo quando showTrainingStats definidas como TRUE.

training.size

O tamanho, em termos de contagem de linhas, do conjunto de dados usado para treinar o modelo.

deviance

O desvio de modelo é dado por -2 * ln(L) onde L está a probabilidade de obter as observações com todos os recursos incorporados no modelo.

null.deviance

O desvio nulo é dado por -2 * ln(L0) onde L0 está a probabilidade de obter as observações sem efeito dos recursos. O modelo nulo inclui o viés se houver um no modelo.

aic

O AIC (Critério de Informações do Akaike) é definido como 2 * k ``+ deviance, onde k está o número de coeficientes do modelo. O viés conta como um dos coeficientes. O AIC é uma medida da qualidade relativa do modelo. Trata da compensação entre a bondade do ajuste do modelo (medido por desvio) e a complexidade do modelo (medido pelo número de coeficientes).

coefficients.stats

Esse é um quadro de dados que contém as estatísticas de cada coeficiente no modelo. Para cada coeficiente, as estatísticas a seguir são mostradas. O viés aparece na primeira linha e os coeficientes restantes na ordem crescente de p-value.

  • Estimar o valor de coeficiente estimado do modelo.
  • Std ErrorThis é a raiz quadrada da variação de amostra grande da estimativa do coeficiente.
  • z-ScoreWe pode testar a hipótese nula, que afirma que o coeficiente deve ser zero, em relação à significância do coeficiente calculando a taxa de sua estimativa e seu erro padrão. Na hipótese nula, se não houver nenhuma regularização aplicada, a estimativa do coeficiente preocupante seguirá uma distribuição normal com média 0 e um desvio padrão igual ao erro padrão calculado acima. A pontuação z gera a taxa entre a estimativa de um coeficiente e o erro padrão do coeficiente.
  • Pr(>|z|) Esse é o valor p correspondente para o teste de dois lados da pontuação z. Com base no nível de significância, um indicador de significância é acrescentado ao valor p. Se F(x) for o CDF da distribuição N(0, 1)normal padrão, então P(>|z|) = 2 - ``2 * F(|z|).

Autor(s)

Microsoft Corporation Microsoft Technical Support

Consulte também

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Exemplos


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]