Заметка
Доступ к этой странице требует авторизации. Вы можете попробовать войти в систему или изменить каталог.
Доступ к этой странице требует авторизации. Вы можете попробовать сменить директорию.
Сводка модели машинного обучения Microsoft R.
Использование
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Аргументы
object
Объект модели, возвращаемый из анализа MicrosoftML .
top
Указывает количество верхних коэффициентов для отображения в сводке для линейных моделей, таких как rxLogisticRegression и rxFastLinear. Предвзятость появляется сначала, за которым следует другие весы, отсортированные по их абсолютным значениям в порядке убывания. Если задано значение NULL, отображаются все ненулевых коэффициенты. В противном случае отображаются только первые top коэффициенты.
...
Дополнительные аргументы, передаваемые в метод сводки.
Сведения
Содержит сводные сведения о исходном вызове функции,
набор данных, используемый для обучения модели, и статистики для коэффициентов в модели.
Ценность
Метод summary объектов анализа MicrosoftML возвращает список, включающий исходный вызов функции и используемые базовые параметры. Метод coef возвращает именованный вектор весов, обрабатывая данные из объекта модели.
Для rxLogisticRegression следующая статистика может также присутствовать в сводке, если showTrainingStats задано значение TRUE.
training.size
Размер с точки зрения количества строк набора данных, используемого для обучения модели.
deviance
Отклонение модели определяется -2 * ln(L)L вероятностью получения наблюдений со всеми функциями, включенными в модель.
null.deviance
Отклонение null определяется -2 * ln(L0)L0 тем, где вероятность получения наблюдений без эффекта от признаков. Модель NULL включает предвзятость, если в модели есть одна.
aic
AIC (Критерий информации Akaike) определяется как 2 * k ``+ deviance, где k число коэффициентов модели. Предвзятость считается одним из коэффициентов. AIC — это мера относительного качества модели. Она имеет дело с компромиссом между хорошестью соответствия модели (измеряемой отклонением) и сложностью модели (измеряемой по количеству коэффициентов).
coefficients.stats
Это кадр данных, содержащий статистику для каждого коэффициента в модели. Для каждого коэффициента показаны следующие статистические данные. Предвзятость отображается в первой строке и остальные коэффициенты в порядке возрастания p-value.
- Оценка предполагаемого коэффициента модели.
- Std ErrorThis — это квадратный корень большой выборки дисперсии оценки коэффициента.
- z-ScoreWe может протестировать на основе нулевой гипотезы, которая утверждает, что коэффициент должен быть нулевым, касаясь значения коэффициента, вычисляя соотношение его оценки и его стандартной ошибки. В соответствии с нулевой гипотезой, если не применяется нормализация, оценка относительного коэффициента соответствует нормальному распределению со средним значением 0 и стандартное отклонение, равное стандартной ошибке, вычисленной выше. Оценка z выводит коэффициент между оценкой коэффициента и стандартной ошибкой коэффициента.
- Pr(>|z|) Это соответствующее p-значение для двухсторонного теста z-score. На основе уровня важности индикатор значения добавляется к p-значению. Если
F(x)cdF стандартного нормального распределенияN(0, 1), тоP(>|z|) = 2 - ``2 * F(|z|).
Авторы
Корпорация Майкрософт Microsoft Technical Support
См. также
rxFastTrees, rxFastForest,rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Примеры
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]