summary.mlModel: Ringkasan model Microsoft R Machine Learning.
Ringkasan model Microsoft R Machine Learning.
Penggunaan
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argumen
object
Objek model yang dikembalikan dari analisis MicrosoftML .
top
Menentukan jumlah koefisien teratas untuk ditampilkan dalam ringkasan untuk model linier seperti rxLogisticRegression dan rxFastLinear. Bias muncul terlebih dahulu, diikuti oleh bobot lain, diurutkan berdasarkan nilai absolutnya dalam urutan menurur Jika diatur ke NULL
, semua koefisien non-nol ditampilkan. Jika tidak, hanya koefisien pertama top
yang ditampilkan.
...
Argumen tambahan yang akan diteruskan ke metode ringkasan.
Detail
Menyediakan informasi ringkasan tentang panggilan fungsi asli,
himpunan data yang digunakan untuk melatih model, dan statistik untuk koefisien dalam model.
Nilai
Metode summary
objek analisis MicrosoftML mengembalikan daftar yang menyertakan panggilan fungsi asli dan parameter mendasar yang digunakan. Metode ini coef
mengembalikan vektor bobot bernama, memproses informasi dari objek model.
Untuk rxLogisticRegression, statistik berikut juga dapat ada dalam ringkasan ketika showTrainingStats
diatur ke TRUE
.
training.size
Ukuran, dalam hal jumlah baris, dari himpunan data yang digunakan untuk melatih model.
deviance
Penyimpangan model diberikan oleh -2 * ln(L)
di mana L
adalah kemungkinan mendapatkan pengamatan dengan semua fitur yang tergabung dalam model.
null.deviance
Penyimpangan null diberikan oleh -2 * ln(L0)
di mana L0
adalah kemungkinan mendapatkan pengamatan tanpa efek dari fitur. Model null mencakup bias jika ada satu dalam model.
aic
AIC (Kriteria Informasi Akaike) didefinisikan sebagai 2 * k ``+ deviance
, di mana k
adalah jumlah koefisien model. Bias dihitung sebagai salah satu koefisien. AIC adalah ukuran kualitas relatif model. Ini berkaitan dengan trade-off antara kebaikan kecocokan model (diukur dengan penyimpangan) dan kompleksitas model (diukur dengan jumlah koefisien).
coefficients.stats
Ini adalah bingkai data yang berisi statistik untuk setiap koefisien dalam model. Untuk setiap koefisien, statistik berikut ditampilkan. Bias muncul di baris pertama, dan koefisien yang tersisa dalam urutan naik nilai p.
- Perkirakan Perkiraan nilai koefisien model.
- Std ErrorThis adalah akar kuadrat dari varians sampel besar dari perkiraan koefisien.
- z-ScoreWe dapat menguji terhadap hipotesis null, yang menyatakan bahwa koefisien harus nol, mengenai signifikansi koefisien dengan menghitung rasio perkiraan dan kesalahan standarnya. Di bawah hipotesis null, jika tidak ada regularisasi yang diterapkan, perkiraan koefisien yang menyangkut mengikuti distribusi normal dengan rata-rata 0 dan simpanpan standar yang sama dengan kesalahan standar yang dihitung di atas. Skor z menghasilkan rasio antara perkiraan koefisien dan kesalahan standar koefisien.
- Pr(>|z|) Ini adalah nilai p yang sesuai untuk pengujian dua sisi dari z-score. Berdasarkan tingkat signifikansi, indikator signifikansi ditambahkan ke nilai p. Jika
F(x)
adalah CDF dari distribusiN(0, 1)
normal standar, makaP(>|z|) = 2 - ``2 * F(|z|)
.
Penulis
Microsoft Corporation Microsoft Technical Support
Lihat juga
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Contoh
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]