MicrosoftML (paket R di SQL Server Pembelajaran Mesin Services)
Berlaku untuk: SQL Server 2016 (13.x) dan versi yang lebih baru
MicrosoftML adalah paket R dari Microsoft yang menyediakan algoritma pembelajaran mesin berkinerja tinggi. Ini termasuk fungsi untuk pelatihan dan transformasi, penilaian, analisis teks dan gambar, dan ekstraksi fitur untuk mengambil nilai dari data yang ada. Paket ini disertakan dalam SQL Server Pembelajaran Mesin Services dan SQL Server 2016 R Services dan mendukung performa tinggi pada big data, menggunakan pemrosesan multicore, dan streaming data cepat. MicrosoftML juga mencakup banyak transformasi untuk pemrosesan teks dan gambar.
Dokumentasi referensi lengkap
Paket MicrosoftML didistribusikan dalam beberapa produk Microsoft, tetapi penggunaannya sama baik Anda mendapatkan paket di SQL Server atau produk lain. Karena fungsinya sama, dokumentasi untuk fungsi RevoScaleR individual diterbitkan hanya ke satu lokasi di bawah referensi R. Jika ada perilaku khusus produk, perbedaan akan dicatat di halaman bantuan fungsi.
Versi dan platform
Paket MicrosoftML didasarkan pada R 3.5.2 dan hanya tersedia saat Anda menginstal salah satu produk atau unduhan Microsoft berikut:
Catatan
Versi rilis produk lengkap hanya Windows di SQL Server 2017. Windows dan Linux didukung untuk MicrosoftML di SQL Server 2019.
Dependensi paket
Algoritma di MicrosoftML bergantung pada RevoScaleR untuk:
- Objek sumber data. Data yang digunakan oleh fungsi MicrosoftML dibuat menggunakan fungsi RevoScaleR .
- Komputasi jarak jauh (mengalihkan eksekusi fungsi ke instans SQL Server jarak jauh). Paket RevoScaleR menyediakan fungsi untuk membuat dan mengaktifkan konteks komputasi jarak jauh untuk SQL Server.
Dalam kebanyakan kasus, Anda akan memuat paket bersama-sama setiap kali Anda menggunakan MicrosoftML.
Fungsi menurut kategori
Bagian ini mencantumkan fungsi menurut kategori untuk memberi Anda gambaran tentang bagaimana masing-masing digunakan. Anda juga dapat menggunakan daftar isi untuk menemukan fungsi dalam urutan alfabet.
Algoritma pembelajaran mesin 1
Nama fungsi | Deskripsi |
---|---|
rxFastTrees | Implementasi FastRank, implementasi algoritma peningkatan gradien MART yang efisien. |
rxFastForest | Implementasi forest acak dan forest regresi kuantil menggunakan rxFastTrees. |
rxLogisticRegression | Regresi logistik menggunakan L-BFGS. |
rxOneClassSvm | Satu kelas mendukung mesin vektor. |
rxNeuralNet | Jaring neural biner, multi-kelas, dan regresi. |
rxFastLinear | Pengoptimalan ascent koordinat ganda stochastic untuk klasifikasi dan regresi biner linier. |
rxEnsemble | Melatih sejumlah model dari berbagai jenis untuk mendapatkan performa prediktif yang lebih baik daripada yang dapat diperoleh dari satu model. |
Fungsi 2-Transformasi
Nama fungsi | Deskripsi |
---|---|
concat | Transformasi untuk membuat kolom bernilai vektor tunggal dari beberapa kolom. |
kategoris | Buat vektor indikator menggunakan transformasi kategoris dengan kamus. |
categoricalHash | Mengonversi nilai kategoris menjadi array indikator dengan hashing. |
featurizeText | Menghasilkan sekantong jumlah urutan kata berturut-turut, yang disebut n-gram, dari korpus teks tertentu. Ini menawarkan deteksi bahasa, tokenisasi, penghapusan stopword, normalisasi teks, dan pembuatan fitur. |
getSentiment | Menilai teks bahasa alami dan membuat kolom yang berisi probabilitas bahwa sentimen dalam teks positif. |
ngram | memungkinkan menentukan argumen untuk ekstraksi fitur berbasis hitungan dan berbasis hash. |
pilihColumns | Memilih sekumpulan kolom yang akan dilatang kembali, menghilangkan semua kolom lainnya. |
selectFeatures | Memilih fitur dari variabel yang ditentukan menggunakan mode tertentu. |
loadImage | Memuat data gambar. |
resizeImage | Mengubah ukuran gambar ke dimensi tertentu menggunakan metode mengubah ukuran tertentu. |
extractPixels | Mengekstrak nilai piksel dari gambar. |
featurizeImage | Menampilkan gambar menggunakan model jaringan neural dalam yang telah dilatih sebelumnya. |
3-Fungsi penilaian dan pelatihan
Nama fungsi | Deskripsi |
---|---|
rxPredict.mlModel | Menjalankan pustaka penilaian baik dari SQL Server, menggunakan prosedur tersimpan, atau dari kode R yang memungkinkan penilaian real time untuk memberikan performa prediksi yang jauh lebih cepat. |
rxFeaturize | Mengubah data dari himpunan data input ke himpunan data output. |
mlModel | Menyediakan ringkasan model Microsoft R Pembelajaran Mesin. |
Fungsi 4-Loss untuk klasifikasi dan regresi
Nama fungsi | Deskripsi |
---|---|
ledakan | Spesifikasi untuk fungsi kehilangan klasifikasi eksponensial. |
logLoss | Spesifikasi untuk fungsi kehilangan klasifikasi log. |
hingeLoss | Spesifikasi untuk fungsi kehilangan klasifikasi engsel. |
smoothHingeLoss | Spesifikasi untuk fungsi kehilangan klasifikasi engsel yang lancar. |
poissonLoss | Spesifikasi untuk fungsi kehilangan regresi poisson. |
squaredLoss | Spesifikasi untuk fungsi kehilangan regresi kuadrat. |
Fungsi pemilihan fitur 5
Nama fungsi | Deskripsi |
---|---|
minCount | Spesifikasi untuk pemilihan fitur dalam mode hitungan. |
mutualInformation | Spesifikasi untuk pemilihan fitur dalam mode informasi bersama. |
Fungsi pemodelan 6-Ensemble
Nama fungsi | Deskripsi |
---|---|
fastTrees | Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model Pohon Cepat dengan rxEnsemble. |
fastForest | Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model Fast Forest dengan rxEnsemble. |
fastLinear | Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model Linier Cepat dengan rxEnsemble. |
logisticRegression | Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model Regresi Logistik dengan rxEnsemble. |
oneClassSvm | Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model OneClassSvm dengan rxEnsemble. |
Fungsi jaringan 7-Neural
Nama fungsi | Deskripsi |
---|---|
Optimizer | Menentukan algoritma pengoptimalan untuk algoritma pembelajaran mesin rxNeuralNet . |
Fungsi status 8 Paket
Nama fungsi | Deskripsi |
---|---|
rxHashEnv | Objek lingkungan yang digunakan untuk menyimpan status seluruh paket. |
Cara menggunakan MicrosoftML
Fungsi di MicrosoftML dapat dipanggil dalam kode R yang dienkapsulasi dalam prosedur tersimpan. Sebagian besar pengembang membangun solusi MicrosoftML secara lokal, lalu memigrasikan kode R yang sudah selesai ke prosedur tersimpan sebagai latihan penyebaran.
Paket MicrosoftML untuk R diinstal "out-of-the-box" di SQL Server 2017.
Paket tidak dimuat secara default. Sebagai langkah pertama, muat paket MicrosoftML , lalu muat RevoScaleR jika Anda perlu menggunakan konteks komputasi jarak jauh atau konektivitas terkait atau objek sumber data. Kemudian, referensikan fungsi individual yang Anda butuhkan.
library(microsoftml);
library(RevoScaleR);
logisticRegression(args);