revoscalepy (paket Python di SQL Server Machine Learning Services)

Berlaku untuk: SQL Server 2017 (14.x) dan yang lebih baru

revoscalepy adalah paket Python dari Microsoft yang mendukung komputasi terdistribusi, konteks komputasi jarak jauh, dan algoritma ilmu data berkinerja tinggi. Paket ini disertakan dalam SQL Server Machine Learning Services.

Paket ini menawarkan fungsionalitas berikut:

  • Konteks komputasi lokal dan jarak jauh pada sistem yang memiliki versi revoscalepy yang sama
  • Fungsi transformasi dan visualisasi data
  • Fungsi ilmu data, dapat diskalakan melalui pemrosesan terdistribusi atau paralel
  • Peningkatan performa, termasuk penggunaan pustaka matematika Intel

Sumber data dan konteks komputasi yang Anda buat dalam revoscalepy juga dapat digunakan dalam algoritma pembelajaran mesin. Untuk pengenalan algoritma ini, lihat modul Python microsoftml di SQL Server.

Dokumentasi referensi lengkap

Paket revoscalepy didistribusikan dalam beberapa produk Microsoft, tetapi penggunaannya sama baik Anda mendapatkan paket di SQL Server atau produk lain. Karena fungsinya sama, dokumentasi untuk fungsi revoscalepy individu diterbitkan hanya ke satu lokasi di bawah referensi Python. Jika ada perilaku khusus produk, perbedaan akan dicatat di halaman bantuan fungsi.

Versi dan platform

Modul revoscalepy didasarkan pada Python 3.5 dan hanya tersedia saat Anda menginstal salah satu produk atau unduhan Microsoft berikut:

Catatan

Versi rilis produk lengkap hanya Windows di SQL Server 2017. Windows dan Linux didukung untuk pencabutan skala pada SQL Server 2019 dan yang lebih baru.

Fungsi menurut kategori

Bagian ini mencantumkan fungsi menurut kategori untuk memberi Anda gambaran tentang bagaimana masing-masing digunakan. Anda juga dapat menggunakan daftar isi untuk menemukan fungsi dalam urutan alfabet.

Sumber dan komputasi 1-Data

revoscalepy mencakup fungsi untuk membuat sumber data dan mengatur lokasi, atau konteks komputasi, tempat komputasi dilakukan. Fungsi yang relevan dengan skenario SQL Server tercantum dalam tabel di bawah ini.

SQL Server dan Python menggunakan jenis data yang berbeda dalam beberapa kasus. Untuk daftar pemetaan antara jenis data SQL dan Python, lihat jenis data Python-to-SQL.

Fungsi Deskripsi
RxInSqlServer Buat objek konteks komputasi SQL Server untuk mendorong komputasi ke instans jarak jauh. Beberapa fungsi revoscalepy mengambil konteks komputasi sebagai argumen. Untuk contoh pengalihan konteks, lihat Membuat model menggunakan revoscalepy.
RxSqlServerData Buat objek data berdasarkan kueri atau tabel SQL Server.
RxOdbcData Buat sumber data berdasarkan koneksi ODBC.
RxXdfData Buat sumber data berdasarkan file XDF lokal. File XDF sering digunakan untuk membongkar data dalam memori ke disk. File XDF dapat berguna saat bekerja dengan lebih banyak data daripada yang dapat ditransfer dari database dalam satu batch, atau lebih banyak data daripada yang dapat dipaskan dalam memori. Misalnya, jika Anda secara teratur memindahkan data dalam jumlah besar dari database ke stasiun kerja lokal, daripada mengkueri database berulang kali untuk setiap operasi R, Anda dapat menggunakan file XDF sebagai semacam cache untuk menyimpan data secara lokal lalu bekerja dengannya di ruang kerja R Anda.

Tip

Jika Anda baru menggunakan ide sumber data atau konteks komputasi, kami sarankan Anda memulai dengan artikel Komputasi terdistribusi.

2-Manipulasi data (ETL)

Fungsi Deskripsi
rx_import Impor data ke dalam file .xdf atau bingkai data.
rx_data_step Mengubah data dari himpunan data input menjadi himpunan data output.

3-Pelatihan dan ringkasan

Fungsi Deskripsi
rx_btrees Pas gradien stochastic yang didorong pohon keputusan
rx_dforest Sesuaikan klasifikasi dan hutan keputusan regresi
rx_dtree Paskan klasifikasi dan pohon regresi
rx_lin_mod Membuat model regresi linier
rx_logit Membuat model regresi logistik
rx_summary Menghasilkan ringkasan univariat objek dalam revoscalepy.

Anda juga harus meninjau fungsi di microsoftml untuk pendekatan tambahan.

Fungsi 4-Penilaian

Fungsi Deskripsi
rx_predict Hasilkan prediksi dari model terlatih dan dapat digunakan untuk penilaian real time.
rx_predict_default Menghitung nilai dan residu yang diprediksi menggunakan objek rx_lin_mod dan rx_logit.
rx_predict_rx_dforest Menghitung nilai yang diprediksi atau sesuai untuk himpunan data dari objek rx_dforest atau rx_btrees.
rx_predict_rx_dtree Menghitung nilai yang diprediksi atau sesuai untuk himpunan data dari objek rx_dtree.

Cara bekerja dengan revoscalepy

Fungsi dalam revoscalepy dapat dipanggil dalam kode Python yang dienkapsulasi dalam prosedur tersimpan. Sebagian besar pengembang membangun solusi revoscalepy secara lokal, dan kemudian memigrasikan kode Python yang sudah selesai ke prosedur tersimpan sebagai latihan penyebaran.

Saat berjalan secara lokal, Anda biasanya menjalankan skrip Python dari baris perintah, atau dari lingkungan pengembangan Python, dan menentukan konteks komputasi SQL Server menggunakan salah satu fungsi revoscalepy. Anda dapat menggunakan konteks komputasi jarak jauh untuk seluruh kode, atau untuk fungsi individual. Misalnya, Anda mungkin ingin membongkar pelatihan model ke server untuk menggunakan data terbaru dan menghindari pergerakan data.

Ketika Anda siap untuk merangkum skrip Python di dalam prosedur tersimpan, sp_execute_external_script, sebaiknya tulis ulang kode sebagai fungsi tunggal yang memiliki input dan output yang ditentukan dengan jelas.

Input dan output harus berupa bingkai data panda . Setelah ini selesai, Anda dapat memanggil prosedur tersimpan dari klien mana pun yang mendukung T-SQL, dengan mudah meneruskan kueri SQL sebagai input, dan menyimpan hasilnya ke tabel SQL. Misalnya, lihat Pelajari analitik Python dalam database untuk pengembang SQL.

Menggunakan revoscalepy dengan microsoftml

Fungsi Python untuk microsoftml terintegrasi dengan konteks komputasi dan sumber data yang disediakan dalam pencabutan skala. Saat memanggil fungsi dari microsoftml, misalnya saat menentukan dan melatih model, gunakan fungsi revoscalepy untuk menjalankan kode Python baik secara lokal atau dalam konteks komputasi jarak jauh SQL Server.

Contoh berikut menunjukkan sintaks untuk mengimpor modul dalam kode Python Anda. Anda kemudian dapat mereferensikan fungsi individual yang Anda butuhkan.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Lihat juga