Ескертпе
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Жүйеге кіруді немесе каталогтарды өзгертуді байқап көруге болады.
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Каталогтарды өзгертуді байқап көруге болады.
Сводка модели машинного обучения Microsoft R.
Использование
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Аргументы
object
Объект модели, возвращаемый из анализа MicrosoftML .
top
Указывает количество верхних коэффициентов для отображения в сводке для линейных моделей, таких как rxLogisticRegression и rxFastLinear. Предвзятость появляется сначала, за которым следует другие весы, отсортированные по их абсолютным значениям в порядке убывания. Если задано значение NULL, отображаются все ненулевых коэффициенты. В противном случае отображаются только первые top коэффициенты.
...
Дополнительные аргументы, передаваемые в метод сводки.
Сведения
Содержит сводные сведения о исходном вызове функции,
набор данных, используемый для обучения модели, и статистики для коэффициентов в модели.
Ценность
Метод summary объектов анализа MicrosoftML возвращает список, включающий исходный вызов функции и используемые базовые параметры. Метод coef возвращает именованный вектор весов, обрабатывая данные из объекта модели.
Для rxLogisticRegression следующая статистика может также присутствовать в сводке, если showTrainingStats задано значение TRUE.
training.size
Размер с точки зрения количества строк набора данных, используемого для обучения модели.
deviance
Отклонение модели определяется -2 * ln(L)L вероятностью получения наблюдений со всеми функциями, включенными в модель.
null.deviance
Отклонение null определяется -2 * ln(L0)L0 тем, где вероятность получения наблюдений без эффекта от признаков. Модель NULL включает предвзятость, если в модели есть одна.
aic
AIC (Критерий информации Akaike) определяется как 2 * k ``+ deviance, где k число коэффициентов модели. Предвзятость считается одним из коэффициентов. AIC — это мера относительного качества модели. Она имеет дело с компромиссом между хорошестью соответствия модели (измеряемой отклонением) и сложностью модели (измеряемой по количеству коэффициентов).
coefficients.stats
Это кадр данных, содержащий статистику для каждого коэффициента в модели. Для каждого коэффициента показаны следующие статистические данные. Предвзятость отображается в первой строке и остальные коэффициенты в порядке возрастания p-value.
- Оценка предполагаемого коэффициента модели.
- Std ErrorThis — это квадратный корень большой выборки дисперсии оценки коэффициента.
- z-ScoreWe может протестировать на основе нулевой гипотезы, которая утверждает, что коэффициент должен быть нулевым, касаясь значения коэффициента, вычисляя соотношение его оценки и его стандартной ошибки. В соответствии с нулевой гипотезой, если не применяется нормализация, оценка относительного коэффициента соответствует нормальному распределению со средним значением 0 и стандартное отклонение, равное стандартной ошибке, вычисленной выше. Оценка z выводит коэффициент между оценкой коэффициента и стандартной ошибкой коэффициента.
- Pr(>|z|) Это соответствующее p-значение для двухсторонного теста z-score. На основе уровня важности индикатор значения добавляется к p-значению. Если
F(x)cdF стандартного нормального распределенияN(0, 1), тоP(>|z|) = 2 - ``2 * F(|z|).
Авторы
Корпорация Майкрософт Microsoft Technical Support
См. также
rxFastTrees, rxFastForest,rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Примеры
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]