summary.mlModel: Ringkasan model Microsoft R Machine Learning.

Ringkasan model Microsoft R Machine Learning.

Penggunaan

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Argumen

object

Objek model yang dikembalikan dari analisis MicrosoftML .

top

Menentukan jumlah koefisien teratas untuk ditampilkan dalam ringkasan untuk model linier seperti rxLogisticRegression dan rxFastLinear. Bias muncul terlebih dahulu, diikuti oleh bobot lain, diurutkan berdasarkan nilai absolutnya dalam urutan menurur Jika diatur ke NULL, semua koefisien non-nol ditampilkan. Jika tidak, hanya koefisien pertama topyang ditampilkan.

...

Argumen tambahan yang akan diteruskan ke metode ringkasan.

Detail

Menyediakan informasi ringkasan tentang panggilan fungsi asli,
himpunan data yang digunakan untuk melatih model, dan statistik untuk koefisien dalam model.

Nilai

Metode summary objek analisis MicrosoftML mengembalikan daftar yang menyertakan panggilan fungsi asli dan parameter mendasar yang digunakan. Metode ini coef mengembalikan vektor bobot bernama, memproses informasi dari objek model.

Untuk rxLogisticRegression, statistik berikut juga dapat ada dalam ringkasan ketika showTrainingStats diatur ke TRUE.

training.size

Ukuran, dalam hal jumlah baris, dari himpunan data yang digunakan untuk melatih model.

deviance

Penyimpangan model diberikan oleh -2 * ln(L) di mana L adalah kemungkinan mendapatkan pengamatan dengan semua fitur yang tergabung dalam model.

null.deviance

Penyimpangan null diberikan oleh -2 * ln(L0) di mana L0 adalah kemungkinan mendapatkan pengamatan tanpa efek dari fitur. Model null mencakup bias jika ada satu dalam model.

aic

AIC (Kriteria Informasi Akaike) didefinisikan sebagai 2 * k ``+ deviance, di mana k adalah jumlah koefisien model. Bias dihitung sebagai salah satu koefisien. AIC adalah ukuran kualitas relatif model. Ini berkaitan dengan trade-off antara kebaikan kecocokan model (diukur dengan penyimpangan) dan kompleksitas model (diukur dengan jumlah koefisien).

coefficients.stats

Ini adalah bingkai data yang berisi statistik untuk setiap koefisien dalam model. Untuk setiap koefisien, statistik berikut ditampilkan. Bias muncul di baris pertama, dan koefisien yang tersisa dalam urutan naik nilai p.

  • Perkirakan Perkiraan nilai koefisien model.
  • Std ErrorThis adalah akar kuadrat dari varians sampel besar dari perkiraan koefisien.
  • z-ScoreWe dapat menguji terhadap hipotesis null, yang menyatakan bahwa koefisien harus nol, mengenai signifikansi koefisien dengan menghitung rasio perkiraan dan kesalahan standarnya. Di bawah hipotesis null, jika tidak ada regularisasi yang diterapkan, perkiraan koefisien yang menyangkut mengikuti distribusi normal dengan rata-rata 0 dan simpanpan standar yang sama dengan kesalahan standar yang dihitung di atas. Skor z menghasilkan rasio antara perkiraan koefisien dan kesalahan standar koefisien.
  • Pr(>|z|) Ini adalah nilai p yang sesuai untuk pengujian dua sisi dari z-score. Berdasarkan tingkat signifikansi, indikator signifikansi ditambahkan ke nilai p. Jika F(x) adalah CDF dari distribusi N(0, 1)normal standar, maka P(>|z|) = 2 - ``2 * F(|z|).

Penulis

Microsoft Corporation Microsoft Technical Support

Lihat juga

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Contoh


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]