revoscalepy (paket Python di SQL Server Pembelajaran Mesin Services)
Berlaku untuk: SQL Server 2017 (14.x) dan yang lebih baru
revoscalepy adalah paket Python dari Microsoft yang mendukung komputasi terdistribusi, konteks komputasi jarak jauh, dan algoritma ilmu data berperforma tinggi. Paket ini disertakan dalam SQL Server Pembelajaran Mesin Services.
Paket ini menawarkan fungsionalitas berikut:
- Konteks komputasi lokal dan jarak jauh pada sistem yang memiliki versi pencabutan yang sama
- Fungsi transformasi dan visualisasi data
- Fungsi ilmu data, dapat diskalakan melalui pemrosesan terdistribusi atau paralel
- Peningkatan performa, termasuk penggunaan pustaka matematika Intel
Sumber data dan konteks komputasi yang Anda buat dalam pencabutan skala juga dapat digunakan dalam algoritma pembelajaran mesin. Untuk pengenalan algoritma ini, lihat modul Python microsoftml di SQL Server.
Dokumentasi referensi lengkap
Paket pencabutan skala didistribusikan dalam beberapa produk Microsoft, tetapi penggunaannya sama apakah Anda mendapatkan paket di SQL Server atau produk lain. Karena fungsinya sama, dokumentasi untuk fungsi pencabutan skala individu diterbitkan hanya ke satu lokasi di bawah referensi Python. Jika ada perilaku khusus produk, perbedaan akan dicatat di halaman bantuan fungsi.
Versi dan platform
Modul revoscalepy didasarkan pada Python 3.5 dan hanya tersedia saat Anda menginstal salah satu produk atau unduhan Microsoft berikut:
Catatan
Versi rilis produk lengkap hanya Windows di SQL Server 2017. Windows dan Linux didukung untuk pencabutan skala di SQL Server 2019 dan yang lebih baru.
Fungsi menurut kategori
Bagian ini mencantumkan fungsi menurut kategori untuk memberi Anda gambaran tentang bagaimana masing-masing digunakan. Anda juga dapat menggunakan daftar isi untuk menemukan fungsi dalam urutan alfabet.
Sumber dan komputasi 1-Data
revoscalepy mencakup fungsi untuk membuat sumber data dan mengatur lokasi, atau konteks komputasi, tempat komputasi dilakukan. Fungsi yang relevan dengan skenario SQL Server tercantum dalam tabel di bawah ini.
SQL Server dan Python menggunakan jenis data yang berbeda dalam beberapa kasus. Untuk daftar pemetaan antara jenis data SQL dan Python, lihat jenis data Python-to-SQL.
Fungsi | Deskripsi |
---|---|
RxInSqlServer | Buat objek konteks komputasi SQL Server untuk mendorong komputasi ke instans jarak jauh. Beberapa fungsi pencabutan skala mengambil konteks komputasi sebagai argumen. Untuk contoh pengalihan konteks, lihat Membuat model menggunakan revoscalepy. |
RxSqlServerData | Buat objek data berdasarkan kueri atau tabel SQL Server. |
RxOdbcData | Buat sumber data berdasarkan koneksi ODBC. |
RxXdfData | Buat sumber data berdasarkan file XDF lokal. File XDF sering digunakan untuk membongkar data dalam memori ke disk. File XDF dapat berguna saat bekerja dengan lebih banyak data daripada yang dapat ditransfer dari database dalam satu batch, atau lebih banyak data daripada yang dapat pas dalam memori. Misalnya, jika Anda memindahkan data dalam jumlah besar secara teratur dari database ke stasiun kerja lokal, daripada mengkueri database berulang kali untuk setiap operasi R, Anda dapat menggunakan file XDF sebagai semacam cache untuk menyimpan data secara lokal lalu bekerja dengannya di ruang kerja R Anda. |
Tip
Jika Anda baru mengetahui ide sumber data atau konteks komputasi, kami sarankan Anda memulai dengan artikel Komputasi terdistribusi.
Manipulasi 2-Data (ETL)
Fungsi | Deskripsi |
---|---|
rx_import | Impor data ke dalam file .xdf atau bingkai data. |
rx_data_step | Mengubah data dari himpunan data input ke himpunan data output. |
3-Pelatihan dan ringkasan
Fungsi | Deskripsi |
---|---|
rx_btrees | Paskan pohon keputusan gradien stochastic yang didorong |
rx_dforest | Sesuaikan klasifikasi dan hutan keputusan regresi |
rx_dtree | Sesuaikan klasifikasi dan pohon regresi |
rx_lin_mod | Membuat model regresi linier |
rx_logit | Membuat model regresi logistik |
rx_summary | Menghasilkan ringkasan univariat objek dalam pencabutan skala. |
Anda juga harus meninjau fungsi di microsoftml untuk pendekatan tambahan.
Fungsi 4-Penilaian
Fungsi | Deskripsi |
---|---|
rx_predict | Hasilkan prediksi dari model terlatih dan dapat digunakan untuk penilaian real time. |
rx_predict_default | Menghitung nilai dan residu yang diprediksi menggunakan objek rx_lin_mod dan rx_logit. |
rx_predict_rx_dforest | Hitung nilai yang diprediksi atau pas untuk himpunan data dari objek rx_dforest atau rx_btrees. |
rx_predict_rx_dtree | Hitung nilai yang diprediksi atau dipasang untuk himpunan data dari objek rx_dtree. |
Cara bekerja dengan revoscalepy
Fungsi dalam revoscalepy dapat dipanggil dalam kode Python yang dienkapsulasi dalam prosedur tersimpan. Sebagian besar pengembang membangun solusi pencabutan skala secara lokal, lalu memigrasikan kode Python yang sudah selesai ke prosedur tersimpan sebagai latihan penyebaran.
Saat berjalan secara lokal, Anda biasanya menjalankan skrip Python dari baris perintah, atau dari lingkungan pengembangan Python, dan menentukan konteks komputasi SQL Server menggunakan salah satu fungsi revoscalepy . Anda dapat menggunakan konteks komputasi jarak jauh untuk seluruh kode, atau untuk fungsi individual. Misalnya, Anda mungkin ingin membongkar pelatihan model ke server untuk menggunakan data terbaru dan menghindari pergerakan data.
Ketika Anda siap untuk merangkum skrip Python di dalam prosedur tersimpan, sp_execute_external_script, sebaiknya tulis ulang kode sebagai fungsi tunggal yang memiliki input dan output yang ditentukan dengan jelas.
Input dan output harus berupa bingkai data panda . Setelah ini selesai, Anda dapat memanggil prosedur tersimpan dari klien mana pun yang mendukung T-SQL, dengan mudah meneruskan kueri SQL sebagai input, dan menyimpan hasilnya ke tabel SQL. Misalnya, lihat Pelajari analitik Python dalam database untuk pengembang SQL.
Menggunakan revoscalepy dengan microsoftml
Fungsi Python untuk microsoftml terintegrasi dengan konteks komputasi dan sumber data yang disediakan dalam pencabutan skala. Saat memanggil fungsi dari microsoftml, misalnya saat menentukan dan melatih model, gunakan fungsi revoscalepy untuk menjalankan kode Python baik secara lokal atau dalam konteks komputasi jarak jauh SQL Server.
Contoh berikut menunjukkan sintaks untuk mengimpor modul dalam kode Python Anda. Anda kemudian dapat mereferensikan fungsi individual yang Anda butuhkan.
from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource