rxPredict.mlModel: Skor menggunakan model Microsoft R Machine Learning
Laporan penilaian per instans menghasilkan bingkai data atau sumber data RevoScaleR menggunakan model Microsoft R Machine Learning terlatih dengan sumber data RevoScaleR.
Penggunaan
## S3 method for class `mlModel':
rxPredict (modelObject, data, outData = NULL,
writeModelVars = FALSE, extraVarsToWrite = NULL, suffix = NULL,
overwrite = FALSE, dataThreads = NULL,
blocksPerRead = rxGetOption("blocksPerRead"),
reportProgress = rxGetOption("reportProgress"), verbose = 1,
computeContext = rxGetOption("computeContext"), ...)
Argumen
modelObject
Objek informasi model yang dikembalikan dari model MicrosoftML. Misalnya, objek yang dikembalikan dari rxFastTrees atau rxLogisticRegression.
data
Objek sumber data RevoScaleR , bingkai data, atau jalur ke .xdf
file.
outData
Teks output atau nama file xdf atau RxDataSource
dengan kemampuan tulis untuk menyimpan prediksi. Jika NULL
, bingkai data dikembalikan. Nilai defaultnya adalah NULL
.
writeModelVars
Jika TRUE
, variabel dalam model ditulis ke himpunan data output selain variabel penilaian. Jika variabel dari himpunan data input diubah dalam model, variabel yang diubah juga disertakan. Nilai defaultnya adalah FALSE
.
extraVarsToWrite
NULL
atau vektor karakter nama variabel tambahan dari data input untuk disertakan outData
dalam . Jika writeModelVars
adalah TRUE
, variabel model juga disertakan. Nilai defaultnya adalah NULL
.
suffix
String karakter yang menentukan akhiran untuk ditambahkan ke variabel penilaian yang dibuat atau NULL
di tidak ada akhiran. Nilai defaultnya adalah NULL
.
overwrite
Jika TRUE
, yang ada outData
ditimpa; jika FALSE
yang ada outData
tidak ditimpa. Nilai defaultnya adalah FALSE
.
dataThreads
Bilangan bulat yang menentukan tingkat paralelisme yang diinginkan dalam alur data. Jika NULL
, jumlah utas yang digunakan ditentukan secara internal. Nilai defaultnya adalah NULL
.
blocksPerRead
Menentukan jumlah blok yang akan dibaca untuk setiap potongan data yang dibaca dari sumber data.
reportProgress
Nilai bilangan bulat yang menentukan tingkat pelaporan pada kemajuan pemrosesan baris:
0
: tidak ada kemajuan yang dilaporkan.1
: jumlah baris yang diproses dicetak dan diperbarui.2
: baris yang diproses dan waktu dilaporkan.3
: baris yang diproses dan semua waktu dilaporkan.
Nilai defaultnya adalah1
.
verbose
Nilai bilangan bulat yang menentukan jumlah output yang diinginkan. Jika 0
, tidak ada output verbose yang dicetak selama perhitungan. Nilai bilangan bulat dari 1
untuk 4
memberikan peningkatan jumlah informasi. Nilai defaultnya adalah 1
.
computeContext
Mengatur konteks di mana komputasi dijalankan, ditentukan dengan RxComputeContext yang valid. Saat ini konteks komputasi lokal dan RxInSqlServer didukung.
...
Argumen tambahan yang akan diteruskan langsung ke Microsoft Compute Engine.
Detail
Item berikut dilaporkan dalam output secara default: menilai tiga variabel untuk pengklasifikasi biner: PredictedLabel, Score, dan Probability; Skor untuk oneClassSvm dan pengklasifikasi regresi; PredictedLabel untuk pengklasifikasi Multi-kelas, ditambah variabel untuk setiap kategori yang ditambahkan sebelumnya oleh Skor.
Nilai
Bingkai data atau objek RxDataSource yang mewakili data output yang dibuat. Secara default, output dari penilaian pengklasifikasi biner mencakup tiga variabel: PredictedLabel
, , Score
dan Probability
; rxOneClassSvm
dan regresi mencakup satu variabel: Score
; dan pengklasifikasi multi-kelas termasuk PredictedLabel
ditambah variabel untuk setiap kategori yang diawali oleh Score
. suffix
Jika disediakan, itu ditambahkan ke akhir nama variabel output ini.
Penulis
Microsoft Corporation Microsoft Technical Support
Lihat juga
rxFastTrees, rxFastForest, rxLogisticRegression, rxNeuralNet, rxOneClassSvm.
Contoh
# Estimate a logistic regression model
infert1 <- infert
infert1$isCase <- (infert1$case == 1)
myModelInfo <- rxLogisticRegression(formula = isCase ~ age + parity + education + spontaneous + induced,
data = infert1)
# Create an xdf file with per-instance results using rxPredict
xdfOut <- tempfile(pattern = "scoreOut", fileext = ".xdf")
scoreDS <- rxPredict(myModelInfo, data = infert1,
outData = xdfOut, overwrite = TRUE,
extraVarsToWrite = c("isCase", "Probability"))
# Summarize results with an ROC curve
rxRocCurve(actualVarName = "isCase", predVarNames = "Probability", data = scoreDS)
# Use the built-in data set 'airquality' to create test and train data
DF <- airquality[!is.na(airquality$Ozone), ]
DF$Ozone <- as.numeric(DF$Ozone)
set.seed(12)
randomSplit <- rnorm(nrow(DF))
trainAir <- DF[randomSplit >= 0,]
testAir <- DF[randomSplit < 0,]
airFormula <- Ozone ~ Solar.R + Wind + Temp
# Regression Fast Tree for train data
fastTreeReg <- rxFastTrees(airFormula, type = "regression",
data = trainAir)
# Put score and model variables in data frame, including the model variables
# Add the suffix "Pred" to the new variable
fastTreeScoreDF <- rxPredict(fastTreeReg, data = testAir,
writeModelVars = TRUE, suffix = "Pred")
rxGetVarInfo(fastTreeScoreDF)
# Clean-up
file.remove(xdfOut)
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk