MicrosoftML (paket R di SQL Server Pembelajaran Mesin Services)

Berlaku untuk: SQL Server 2016 (13.x) dan versi yang lebih baru

MicrosoftML adalah paket R dari Microsoft yang menyediakan algoritma pembelajaran mesin berkinerja tinggi. Ini termasuk fungsi untuk pelatihan dan transformasi, penilaian, analisis teks dan gambar, dan ekstraksi fitur untuk mengambil nilai dari data yang ada. Paket ini disertakan dalam SQL Server Pembelajaran Mesin Services dan SQL Server 2016 R Services dan mendukung performa tinggi pada big data, menggunakan pemrosesan multicore, dan streaming data cepat. MicrosoftML juga mencakup banyak transformasi untuk pemrosesan teks dan gambar.

Dokumentasi referensi lengkap

Paket MicrosoftML didistribusikan dalam beberapa produk Microsoft, tetapi penggunaannya sama baik Anda mendapatkan paket di SQL Server atau produk lain. Karena fungsinya sama, dokumentasi untuk fungsi RevoScaleR individual diterbitkan hanya ke satu lokasi di bawah referensi R. Jika ada perilaku khusus produk, perbedaan akan dicatat di halaman bantuan fungsi.

Versi dan platform

Paket MicrosoftML didasarkan pada R 3.5.2 dan hanya tersedia saat Anda menginstal salah satu produk atau unduhan Microsoft berikut:

Catatan

Versi rilis produk lengkap hanya Windows di SQL Server 2017. Windows dan Linux didukung untuk MicrosoftML di SQL Server 2019.

Dependensi paket

Algoritma di MicrosoftML bergantung pada RevoScaleR untuk:

  • Objek sumber data. Data yang digunakan oleh fungsi MicrosoftML dibuat menggunakan fungsi RevoScaleR .
  • Komputasi jarak jauh (mengalihkan eksekusi fungsi ke instans SQL Server jarak jauh). Paket RevoScaleR menyediakan fungsi untuk membuat dan mengaktifkan konteks komputasi jarak jauh untuk SQL Server.

Dalam kebanyakan kasus, Anda akan memuat paket bersama-sama setiap kali Anda menggunakan MicrosoftML.

Fungsi menurut kategori

Bagian ini mencantumkan fungsi menurut kategori untuk memberi Anda gambaran tentang bagaimana masing-masing digunakan. Anda juga dapat menggunakan daftar isi untuk menemukan fungsi dalam urutan alfabet.

Algoritma pembelajaran mesin 1

Nama fungsi Deskripsi
rxFastTrees Implementasi FastRank, implementasi algoritma peningkatan gradien MART yang efisien.
rxFastForest Implementasi forest acak dan forest regresi kuantil menggunakan rxFastTrees.
rxLogisticRegression Regresi logistik menggunakan L-BFGS.
rxOneClassSvm Satu kelas mendukung mesin vektor.
rxNeuralNet Jaring neural biner, multi-kelas, dan regresi.
rxFastLinear Pengoptimalan ascent koordinat ganda stochastic untuk klasifikasi dan regresi biner linier.
rxEnsemble Melatih sejumlah model dari berbagai jenis untuk mendapatkan performa prediktif yang lebih baik daripada yang dapat diperoleh dari satu model.

Fungsi 2-Transformasi

Nama fungsi Deskripsi
concat Transformasi untuk membuat kolom bernilai vektor tunggal dari beberapa kolom.
kategoris Buat vektor indikator menggunakan transformasi kategoris dengan kamus.
categoricalHash Mengonversi nilai kategoris menjadi array indikator dengan hashing.
featurizeText Menghasilkan sekantong jumlah urutan kata berturut-turut, yang disebut n-gram, dari korpus teks tertentu. Ini menawarkan deteksi bahasa, tokenisasi, penghapusan stopword, normalisasi teks, dan pembuatan fitur.
getSentiment Menilai teks bahasa alami dan membuat kolom yang berisi probabilitas bahwa sentimen dalam teks positif.
ngram memungkinkan menentukan argumen untuk ekstraksi fitur berbasis hitungan dan berbasis hash.
pilihColumns Memilih sekumpulan kolom yang akan dilatang kembali, menghilangkan semua kolom lainnya.
selectFeatures Memilih fitur dari variabel yang ditentukan menggunakan mode tertentu.
loadImage Memuat data gambar.
resizeImage Mengubah ukuran gambar ke dimensi tertentu menggunakan metode mengubah ukuran tertentu.
extractPixels Mengekstrak nilai piksel dari gambar.
featurizeImage Menampilkan gambar menggunakan model jaringan neural dalam yang telah dilatih sebelumnya.

3-Fungsi penilaian dan pelatihan

Nama fungsi Deskripsi
rxPredict.mlModel Menjalankan pustaka penilaian baik dari SQL Server, menggunakan prosedur tersimpan, atau dari kode R yang memungkinkan penilaian real time untuk memberikan performa prediksi yang jauh lebih cepat.
rxFeaturize Mengubah data dari himpunan data input ke himpunan data output.
mlModel Menyediakan ringkasan model Microsoft R Pembelajaran Mesin.

Fungsi 4-Loss untuk klasifikasi dan regresi

Nama fungsi Deskripsi
ledakan Spesifikasi untuk fungsi kehilangan klasifikasi eksponensial.
logLoss Spesifikasi untuk fungsi kehilangan klasifikasi log.
hingeLoss Spesifikasi untuk fungsi kehilangan klasifikasi engsel.
smoothHingeLoss Spesifikasi untuk fungsi kehilangan klasifikasi engsel yang lancar.
poissonLoss Spesifikasi untuk fungsi kehilangan regresi poisson.
squaredLoss Spesifikasi untuk fungsi kehilangan regresi kuadrat.

Fungsi pemilihan fitur 5

Nama fungsi Deskripsi
minCount Spesifikasi untuk pemilihan fitur dalam mode hitungan.
mutualInformation Spesifikasi untuk pemilihan fitur dalam mode informasi bersama.

Fungsi pemodelan 6-Ensemble

Nama fungsi Deskripsi
fastTrees Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model Pohon Cepat dengan rxEnsemble.
fastForest Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model Fast Forest dengan rxEnsemble.
fastLinear Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model Linier Cepat dengan rxEnsemble.
logisticRegression Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model Regresi Logistik dengan rxEnsemble.
oneClassSvm Membuat daftar yang berisi nama fungsi dan argumen untuk melatih model OneClassSvm dengan rxEnsemble.

Fungsi jaringan 7-Neural

Nama fungsi Deskripsi
Optimizer Menentukan algoritma pengoptimalan untuk algoritma pembelajaran mesin rxNeuralNet .

Fungsi status 8 Paket

Nama fungsi Deskripsi
rxHashEnv Objek lingkungan yang digunakan untuk menyimpan status seluruh paket.

Cara menggunakan MicrosoftML

Fungsi di MicrosoftML dapat dipanggil dalam kode R yang dienkapsulasi dalam prosedur tersimpan. Sebagian besar pengembang membangun solusi MicrosoftML secara lokal, lalu memigrasikan kode R yang sudah selesai ke prosedur tersimpan sebagai latihan penyebaran.

Paket MicrosoftML untuk R diinstal "out-of-the-box" di SQL Server 2017.

Paket tidak dimuat secara default. Sebagai langkah pertama, muat paket MicrosoftML , lalu muat RevoScaleR jika Anda perlu menggunakan konteks komputasi jarak jauh atau konektivitas terkait atau objek sumber data. Kemudian, referensikan fungsi individual yang Anda butuhkan.

library(microsoftml);
library(RevoScaleR);
logisticRegression(args);

Baca juga