rxPredict.mlModel: Skor menggunakan model Microsoft R Machine Learning

Laporan penilaian per instans menghasilkan bingkai data atau sumber data RevoScaleR menggunakan model Microsoft R Machine Learning terlatih dengan sumber data RevoScaleR.

Penggunaan

 ## S3 method for class `mlModel':
rxPredict  (modelObject, data, outData = NULL,
    writeModelVars = FALSE, extraVarsToWrite = NULL, suffix = NULL,
    overwrite = FALSE, dataThreads = NULL,
    blocksPerRead = rxGetOption("blocksPerRead"),
    reportProgress = rxGetOption("reportProgress"), verbose = 1,
    computeContext = rxGetOption("computeContext"), ...)

Argumen

modelObject

Objek informasi model yang dikembalikan dari model MicrosoftML. Misalnya, objek yang dikembalikan dari rxFastTrees atau rxLogisticRegression.

data

Objek sumber data RevoScaleR , bingkai data, atau jalur ke .xdf file.

outData

Teks output atau nama file xdf atau RxDataSource dengan kemampuan tulis untuk menyimpan prediksi. Jika NULL, bingkai data dikembalikan. Nilai defaultnya adalah NULL.

writeModelVars

Jika TRUE, variabel dalam model ditulis ke himpunan data output selain variabel penilaian. Jika variabel dari himpunan data input diubah dalam model, variabel yang diubah juga disertakan. Nilai defaultnya adalah FALSE.

extraVarsToWrite

NULL atau vektor karakter nama variabel tambahan dari data input untuk disertakan outDatadalam . Jika writeModelVars adalah TRUE, variabel model juga disertakan. Nilai defaultnya adalah NULL.

suffix

String karakter yang menentukan akhiran untuk ditambahkan ke variabel penilaian yang dibuat atau NULL di tidak ada akhiran. Nilai defaultnya adalah NULL.

overwrite

Jika TRUE, yang ada outData ditimpa; jika FALSE yang ada outData tidak ditimpa. Nilai defaultnya adalah FALSE.

dataThreads

Bilangan bulat yang menentukan tingkat paralelisme yang diinginkan dalam alur data. Jika NULL, jumlah utas yang digunakan ditentukan secara internal. Nilai defaultnya adalah NULL.

blocksPerRead

Menentukan jumlah blok yang akan dibaca untuk setiap potongan data yang dibaca dari sumber data.

reportProgress

Nilai bilangan bulat yang menentukan tingkat pelaporan pada kemajuan pemrosesan baris:

  • 0: tidak ada kemajuan yang dilaporkan.
  • 1: jumlah baris yang diproses dicetak dan diperbarui.
  • 2: baris yang diproses dan waktu dilaporkan.
  • 3: baris yang diproses dan semua waktu dilaporkan.
    Nilai defaultnya adalah 1.

verbose

Nilai bilangan bulat yang menentukan jumlah output yang diinginkan. Jika 0, tidak ada output verbose yang dicetak selama perhitungan. Nilai bilangan bulat dari 1 untuk 4 memberikan peningkatan jumlah informasi. Nilai defaultnya adalah 1.

computeContext

Mengatur konteks di mana komputasi dijalankan, ditentukan dengan RxComputeContext yang valid. Saat ini konteks komputasi lokal dan RxInSqlServer didukung.

...

Argumen tambahan yang akan diteruskan langsung ke Microsoft Compute Engine.

Detail

Item berikut dilaporkan dalam output secara default: menilai tiga variabel untuk pengklasifikasi biner: PredictedLabel, Score, dan Probability; Skor untuk oneClassSvm dan pengklasifikasi regresi; PredictedLabel untuk pengklasifikasi Multi-kelas, ditambah variabel untuk setiap kategori yang ditambahkan sebelumnya oleh Skor.

Nilai

Bingkai data atau objek RxDataSource yang mewakili data output yang dibuat. Secara default, output dari penilaian pengklasifikasi biner mencakup tiga variabel: PredictedLabel, , Scoredan Probability; rxOneClassSvm dan regresi mencakup satu variabel: Score; dan pengklasifikasi multi-kelas termasuk PredictedLabel ditambah variabel untuk setiap kategori yang diawali oleh Score. suffix Jika disediakan, itu ditambahkan ke akhir nama variabel output ini.

Penulis

Microsoft Corporation Microsoft Technical Support

Lihat juga

rxFastTrees, rxFastForest, rxLogisticRegression, rxNeuralNet, rxOneClassSvm.

Contoh



 # Estimate a logistic regression model
 infert1 <- infert
 infert1$isCase <- (infert1$case == 1)
 myModelInfo <- rxLogisticRegression(formula = isCase ~ age + parity + education + spontaneous + induced,
                        data = infert1)

 # Create an xdf file with per-instance results using rxPredict
 xdfOut <- tempfile(pattern = "scoreOut", fileext = ".xdf")
 scoreDS <- rxPredict(myModelInfo, data = infert1,
     outData = xdfOut, overwrite = TRUE,
     extraVarsToWrite = c("isCase", "Probability"))

 # Summarize results with an ROC curve
 rxRocCurve(actualVarName = "isCase", predVarNames = "Probability", data = scoreDS)

 # Use the built-in data set 'airquality' to create test and train data
 DF <- airquality[!is.na(airquality$Ozone), ]  
 DF$Ozone <- as.numeric(DF$Ozone)
 set.seed(12)
 randomSplit <- rnorm(nrow(DF))
 trainAir <- DF[randomSplit >= 0,]
 testAir <- DF[randomSplit < 0,]
 airFormula <- Ozone ~ Solar.R + Wind + Temp

 # Regression Fast Tree for train data
 fastTreeReg <- rxFastTrees(airFormula, type = "regression", 
     data = trainAir)  

 # Put score and model variables in data frame, including the model variables
 # Add the suffix "Pred" to the new variable
 fastTreeScoreDF <- rxPredict(fastTreeReg, data = testAir, 
     writeModelVars = TRUE, suffix = "Pred")

 rxGetVarInfo(fastTreeScoreDF)

 # Clean-up
 file.remove(xdfOut)