Поделиться через


summary.mlModel: сводка модели машинного обучения Microsoft R.

Сводка модели машинного обучения Microsoft R.

Использование

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Аргументы

object

Объект модели, возвращаемый из анализа MicrosoftML .

top

Указывает количество верхних коэффициентов для отображения в сводке для линейных моделей, таких как rxLogisticRegression и rxFastLinear. Предвзятость появляется сначала, за которым следует другие весы, отсортированные по их абсолютным значениям в порядке убывания. Если задано значение NULL, отображаются все ненулевых коэффициенты. В противном случае отображаются только первые top коэффициенты.

...

Дополнительные аргументы, передаваемые в метод сводки.

Сведения

Содержит сводные сведения о исходном вызове функции,
набор данных, используемый для обучения модели, и статистики для коэффициентов в модели.

Ценность

Метод summary объектов анализа MicrosoftML возвращает список, включающий исходный вызов функции и используемые базовые параметры. Метод coef возвращает именованный вектор весов, обрабатывая данные из объекта модели.

Для rxLogisticRegression следующая статистика может также присутствовать в сводке, если showTrainingStats задано значение TRUE.

training.size

Размер с точки зрения количества строк набора данных, используемого для обучения модели.

deviance

Отклонение модели определяется -2 * ln(L)L вероятностью получения наблюдений со всеми функциями, включенными в модель.

null.deviance

Отклонение null определяется -2 * ln(L0)L0 тем, где вероятность получения наблюдений без эффекта от признаков. Модель NULL включает предвзятость, если в модели есть одна.

aic

AIC (Критерий информации Akaike) определяется как 2 * k ``+ deviance, где k число коэффициентов модели. Предвзятость считается одним из коэффициентов. AIC — это мера относительного качества модели. Она имеет дело с компромиссом между хорошестью соответствия модели (измеряемой отклонением) и сложностью модели (измеряемой по количеству коэффициентов).

coefficients.stats

Это кадр данных, содержащий статистику для каждого коэффициента в модели. Для каждого коэффициента показаны следующие статистические данные. Предвзятость отображается в первой строке и остальные коэффициенты в порядке возрастания p-value.

  • Оценка предполагаемого коэффициента модели.
  • Std ErrorThis — это квадратный корень большой выборки дисперсии оценки коэффициента.
  • z-ScoreWe может протестировать на основе нулевой гипотезы, которая утверждает, что коэффициент должен быть нулевым, касаясь значения коэффициента, вычисляя соотношение его оценки и его стандартной ошибки. В соответствии с нулевой гипотезой, если не применяется нормализация, оценка относительного коэффициента соответствует нормальному распределению со средним значением 0 и стандартное отклонение, равное стандартной ошибке, вычисленной выше. Оценка z выводит коэффициент между оценкой коэффициента и стандартной ошибкой коэффициента.
  • Pr(>|z|) Это соответствующее p-значение для двухсторонного теста z-score. На основе уровня важности индикатор значения добавляется к p-значению. Если F(x) cdF стандартного нормального распределения N(0, 1), то P(>|z|) = 2 - ``2 * F(|z|).

Авторы

Корпорация Майкрософт Microsoft Technical Support

См. также

rxFastTrees, rxFastForest,rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Примеры


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]