Apa itu Server Pembelajaran Mesin mandiri atau Server R di SQL Server?
Berlaku untuk: SQL Server 2016 (13.x) dan versi yang lebih baru
Penting
Dukungan untuk Pembelajaran Mesin Server (sebelumnya dikenal sebagai R Server) berakhir pada 1 Juli 2022. Untuk informasi selengkapnya, lihat Apa yang terjadi pada server Pembelajaran Mesin?
SQL Server menyediakan dukungan penginstalan untuk Server R mandiri atau Server Pembelajaran Mesin yang berjalan secara independen dari SQL Server. Bergantung pada versi SQL Server Anda, server mandiri memiliki fondasi R sumber terbuka dan mungkin Python, dilapisi dengan pustaka berkinerja tinggi dari Microsoft yang menambahkan analitik statistik dan prediktif dalam skala besar. Pustaka juga mengaktifkan tugas pembelajaran mesin yang ditulis dalam R atau Python.
Di SQL Server 2016, fitur ini disebut R Server (Standalone) dan bersifat R-only. Di SQL Server 2017, ini disebut Pembelajaran Mesin Server (Mandiri) dan mencakup R dan Python.
Catatan
Seperti yang diinstal oleh Penyiapan SQL Server, server mandiri secara fungsional setara dengan versi Microsoft Pembelajaran Mesin Server bermerek non-SQL, mendukung skenario pengguna yang sama, termasuk eksekusi jarak jauh, operasionalisasi dan layanan web, dan kumpulan lengkap pustaka R dan Python.
Komponen
SQL Server 2016 hanya R. SQL Server 2017 mendukung R dan Python. Tabel berikut ini menjelaskan fitur di setiap versi.
Komponen | Deskripsi |
---|---|
Paket R | RevoScaleR adalah pustaka utama untuk R yang dapat diskalakan dengan fungsi untuk manipulasi data, transformasi, visualisasi, dan analisis. MicrosoftML menambahkan algoritma pembelajaran mesin untuk membuat model kustom untuk analisis teks, analisis gambar, dan analisis sentimen. sqlRUtils menyediakan fungsi pembantu untuk menempatkan skrip R ke dalam prosedur tersimpan T-SQL, mendaftarkan prosedur tersimpan dengan database, dan menjalankan prosedur tersimpan dari lingkungan pengembangan R. olapR adalah untuk menentukan kueri MDX di R. |
Microsoft R Open (MRO) | Microsoft R Open (dihentikan) adalah distribusi sumber terbuka R Microsoft. |
Alat R | Jendela konsol R dan prompt perintah adalah alat standar dalam distribusi R. Temukan di \Program files\Microsoft SQL Server\140\R_SERVER\bin\x64. |
Sampel dan skrip R | Paket R dan RevoScaleR sumber terbuka menyertakan himpunan data bawaan sehingga Anda dapat membuat dan menjalankan skrip menggunakan data yang telah diinstal sebelumnya. Cari di \Program files\Microsoft SQL Server\140\R_SERVER\library\datasets dan \library\RevoScaleR. |
Paket Python | revoscalepy adalah pustaka utama untuk Python yang dapat diskalakan dengan fungsi untuk manipulasi, transformasi, visualisasi, dan analisis data. microsoftml menambahkan algoritma pembelajaran mesin untuk membuat model kustom untuk analisis teks, analisis gambar, dan analisis sentimen. |
Alat Python | Alat baris perintah Python bawaan berguna untuk pengujian dan tugas ad hoc. Temukan alat di \Program files\Microsoft SQL Server\140\PYTHON_SERVER\python.exe. |
Anaconda | Anaconda adalah distribusi sumber terbuka dari Python dan paket penting. |
Sampel dan skrip Python | Seperti halnya R, Python menyertakan himpunan data dan skrip bawaan. Temukan data revoscalepy di \Program files\Microsoft SQL Server\140\PYTHON_SERVER\lib\site-packages\revoscalepy\data\sample-data. |
Model yang telah dilatih sebelumnya di R dan Python | Model yang telah dilatih dibuat untuk kasus penggunaan tertentu dan dikelola oleh tim teknik ilmu data di Microsoft. Anda dapat menggunakan model yang telah dilatih sebelumnya apa adanya untuk menilai sentimen positif-negatif dalam teks, atau mendeteksi fitur dalam gambar, menggunakan input data baru yang Anda berikan. Model yang telah dilatih sebelumnya didukung dan dapat digunakan di server mandiri, tetapi Anda tidak dapat menginstalnya melalui Penyiapan SQL Server. Untuk informasi selengkapnya, lihat Menginstal model pembelajaran mesin yang telah dilatih sebelumnya di SQL Server. |
Menggunakan server mandiri
Pengembang R dan Python biasanya memilih server mandiri untuk bergerak melampaui batasan memori dan pemrosesan sumber terbuka R dan Python. Pustaka R dan Python yang dijalankan pada server mandiri dapat memuat dan memproses data dalam jumlah besar pada beberapa inti dan menggabungkan hasilnya ke dalam satu output terkonsolidasi. Fungsi berperforma tinggi direkayasa untuk skala dan utilitas: memberikan analitik prediktif, pemodelan statistik, visualisasi data, dan algoritma pembelajaran mesin terdepan dalam produk server komersial yang direkayasa dan didukung oleh Microsoft.
Sebagai server independen yang dipisahkan dari SQL Server, lingkungan R dan Python dikonfigurasi, diamankan, dan diakses menggunakan sistem operasi dan alat standar yang mendasar yang disediakan di server mandiri, bukan SQL Server. Tidak ada dukungan bawaan untuk data relasional SQL Server. Jika Anda ingin menggunakan data SQL Server, Anda dapat membuat objek sumber data dan koneksi seperti yang Anda lakukan dari klien mana pun.
Sebagai tambahan untuk SQL Server, server mandiri juga berguna sebagai lingkungan pengembangan yang kuat jika Anda membutuhkan komputasi lokal dan jarak jauh. Paket R dan Python pada server mandiri sama dengan yang disediakan dengan penginstalan mesin database, memungkinkan portabilitas kode dan peralihan konteks komputasi.
Cara memulai
Mulailah dengan penyiapan, lampirkan biner ke alat pengembangan favorit Anda, dan tulis skrip pertama Anda.
Langkah 1: Instal perangkat lunak
Instal salah satu versi ini:
Langkah 2: Mengonfigurasi alat pengembangan
Pada server mandiri, biasanya bekerja secara lokal menggunakan pengembangan yang diinstal pada komputer yang sama.
Langkah 3: Tulis skrip pertama Anda
Tulis skrip R atau Python menggunakan fungsi dari RevoScaleR, revoscalepy, dan algoritma pembelajaran mesin.
Jelajahi R dan RevoScaleR dalam 25 Functions: Mulailah dengan perintah R dasar lalu lanjutkan ke fungsi analitik yang dapat didistribusikan RevoScaleR yang memberikan performa tinggi dan penskalakan ke solusi R. Termasuk versi paralel dari banyak paket pemodelan R paling populer, seperti pengklusteran k-means, pohon keputusan, dan hutan keputusan, dan alat untuk manipulasi data.
Mulai cepat: Contoh klasifikasi biner dengan paket Python microsoftml: Membuat model klasifikasi biner menggunakan fungsi dari microsoftml dan himpunan data kanker payudara yang terkenal.
Pilih bahasa terbaik untuk tugas tersebut. R adalah yang terbaik untuk komputasi statistik yang sulit diterapkan menggunakan SQL. Untuk operasi berbasis set atas data, manfaatkan kekuatan SQL Server untuk mencapai performa maksimum. Gunakan mesin database dalam memori untuk komputasi yang sangat cepat melalui kolom.
Langkah 4: Mengoprasionalkan solusi Anda
Server mandiri dapat menggunakan fungsionalitas operasionalisasi Microsoft Pembelajaran Mesin Server bermerek non-SQL. Anda dapat mengonfigurasi server mandiri untuk operasionalisasi, yang memberi Anda manfaat ini: menyebarkan dan menghosting kode Anda sebagai layanan web, menjalankan diagnostik, menguji kapasitas layanan web.
Langkah 5: Pertahankan server Anda
SQL Server merilis pembaruan kumulatif secara teratur. Menerapkan pembaruan kumulatif menambahkan peningkatan keamanan dan fungsional ke penginstalan yang ada.
Deskripsi fungsionalitas baru atau yang diubah dapat ditemukan di artikel Unduhan CAB dan di halaman web untuk pembaruan kumulatif SQL Server 2016 dan pembaruan kumulatif SQL Server 2017.
Untuk informasi selengkapnya tentang cara menerapkan pembaruan ke instans yang ada, lihat Menerapkan pembaruan dalam instruksi penginstalan.
Lihat juga
Menginstal Server R (Mandiri) atau Server Pembelajaran Mesin (Mandiri)