Apa yang baru di SQL Server Pembelajaran Mesin Services?
Berlaku untuk: SQL Server 2016 (13.x) dan versi yang lebih baru
Artikel ini menjelaskan kemampuan dan fitur baru apa yang disertakan dalam setiap versi SQL Server Pembelajaran Mesin Services. Kemampuan pembelajaran mesin ditambahkan ke SQL Server di setiap rilis saat kami terus memperluas, memperluas, dan memperdalam integrasi antara platform data, analitik tingkat lanjut, dan ilmu data.
Catatan
Kemampuan fitur dan opsi penginstalan bervariasi di antara versi SQL Server. Gunakan menu dropdown pemilih versi untuk memilih versi SQL Server yang sesuai.
Baru di SQL Server 2022
Dimulai dengan SQL Server 2022 (16.x), runtime untuk R, Python, dan Java, tidak lagi diinstal dengan Penyiapan SQL. Sebagai gantinya, instal runtime dan paket kustom yang diinginkan. Untuk informasi selengkapnya, lihat Menginstal SQL Server 2022 Pembelajaran Mesin Services (Python dan R) di Windows atau Menginstal SQL Server Pembelajaran Mesin Services (Python dan R) di Linux.
Baru di SQL Server 2019
Rilis ini menambahkan fitur yang diminta teratas untuk operasi pembelajaran mesin Python dan R di SQL Server. Untuk informasi selengkapnya tentang semua fitur dalam rilis ini, lihat Apa yang Baru di SQL Server 2019 dan Catatan Rilis untuk SQL Server 2019.
Untuk dokumentasi baru tentang Java dan C# di SQL Server 2019, lihat Apa yang baru dalam Ekstensi Bahasa SQL Server?.
Di bawah ini adalah fitur baru untuk SQL Server Pembelajaran Mesin Services, tersedia di Windows dan Linux:
- Dukungan platform Linux ditambahkan di layanan Pembelajaran Mesin untuk Python dan R. Mulai menginstal SQL Server Pembelajaran Mesin Services di Linux.
- Koneksi loopback ke SQL Server dari skrip Python atau R.
- CREATE EXTERNAL LIBRARY (Transact-SQL) untuk Python dan R.
- sp_execute_external_script memperkenalkan dua parameter baru yang memungkinkan Anda menghasilkan beberapa model dengan mudah dari data yang dipartisi. Pelajari selengkapnya dalam tutorial ini, Buat model berbasis partisi di R.
- Dukungan kluster failover tersedia untuk layanan Launchpad, dengan asumsi layanan Launchpad SQL Server dimulai pada semua simpul. Untuk informasi selengkapnya, lihat Penginstalan kluster failover SQL Server.
- Perubahan mekanisme isolasi untuk Layanan Pembelajaran Mesin. Untuk informasi selengkapnya, lihat SQL Server 2019 di Windows: Perubahan isolasi untuk layanan Pembelajaran Mesin.
Baru di SQL Server 2017
Rilis ini menambahkan dukungan Python dan algoritma pembelajaran mesin terkemuka di industri. Diganti namanya untuk mencerminkan cakupan baru, SQL Server 2017 menandai pengenalan SQL Server Pembelajaran Mesin Services (Dalam Database), dengan dukungan bahasa untuk Python dan R.
Untuk pengumuman fitur all-up, lihat Apa yang Baru di SQL Server 2017.
Penyempurnaan R
Komponen R dari Layanan Pembelajaran Mesin SQL Server adalah SQL Server 2016 R Services generasi berikutnya, dengan versi terbaru dari R dasar, RevoScaler, dan paket lainnya.
Kemampuan baru untuk R mencakup manajemen paket, dengan sorotan berikut:
- Peran database membantu DBA mengelola paket dan menetapkan izin untuk penginstalan paket.
- CREATE EXTERNAL LIBRARY membantu DBA mengelola paket dalam bahasa T-SQL yang sudah dikenal.
- Fungsi RevoScaleR membantu menginstal, menghapus, atau mencantumkan paket yang dimiliki oleh pengguna. Untuk informasi selengkapnya, lihat Cara menggunakan fungsi RevoScaleR untuk menemukan atau menginstal paket R di SQL Server.
Pustaka R
Paket | Deskripsi |
---|---|
MicrosoftML | Dalam rilis ini, MicrosoftML disertakan dalam penginstalan R default, menghilangkan langkah peningkatan yang diperlukan di SQL Server 2016 R Services sebelumnya. MicrosoftML menyediakan algoritma pembelajaran mesin canggih dan transformasi data yang dapat diskalakan atau dijalankan dalam konteks komputasi jarak jauh. Algoritma termasuk jaringan neural dalam yang dapat disesuaikan, pohon keputusan cepat dan hutan keputusan, regresi linier, dan regresi logistik. |
Integrasi Python untuk analitik dalam database
Python adalah bahasa yang menawarkan fleksibilitas dan kekuatan besar untuk berbagai tugas pembelajaran mesin. Pustaka sumber terbuka untuk Python mencakup beberapa platform untuk jaringan neural yang dapat disesuaikan, serta pustaka populer untuk pemrosesan bahasa alami.
Karena Python terintegrasi dengan mesin database, Anda dapat menjaga analitik tetap dekat dengan data dan menghilangkan risiko biaya dan keamanan yang terkait dengan pergerakan data. Anda dapat menyebarkan solusi pembelajaran mesin berdasarkan Python menggunakan alat seperti Visual Studio. Aplikasi produksi Anda bisa mendapatkan prediksi, model, atau visual dari runtime Python 3.5 menggunakan metode akses data SQL Server.
Integrasi T-SQL dan Python didukung melalui prosedur tersimpan sistem sp_execute_external_script . Anda dapat memanggil kode Python apa pun menggunakan prosedur tersimpan ini. Kode berjalan dalam arsitektur ganda yang aman yang memungkinkan penyebaran model dan skrip Python tingkat perusahaan, dapat dipanggil dari aplikasi menggunakan prosedur tersimpan sederhana. Perolehan performa tambahan dicapai oleh data streaming dari proses SQL ke Python dan paralelisasi cincin MPI.
Anda dapat menggunakan fungsi T-SQL PREDICT untuk melakukan penilaian asli pada model yang telah dilatih sebelumnya yang telah disimpan dalam format biner yang diperlukan.
Pustaka Python
Paket | Deskripsi |
---|---|
revoscalepy | Setara dengan Python dari RevoScaleR. Anda dapat membuat model Python untuk regresi linier dan logistik, pohon keputusan, pohon yang ditingkatkan, dan hutan acak, semua dapat diparalelkan, dan mampu dijalankan dalam konteks komputasi jarak jauh. Paket ini mendukung penggunaan beberapa sumber data dan konteks komputasi jarak jauh. Ilmuwan atau pengembang data dapat menjalankan kode Python pada SQL Server jarak jauh, untuk menjelajahi data atau membangun model tanpa memindahkan data. |
microsoftml | Python setara dengan paket MicrosoftML R. |
Model yang sudah dilatih sebelumnya
Model yang telah dilatih tersedia untuk Python dan R. Gunakan model ini untuk pengenalan gambar dan analisis sentimen positif-negatif, untuk menghasilkan prediksi pada data Anda sendiri.
Server Mandiri sebagai fitur bersama di Penyiapan SQL Server
Rilis ini juga menambahkan SQL Server Pembelajaran Mesin Server (Standalone), server ilmu data yang sepenuhnya independen, mendukung analitik statistik dan prediktif di R dan Python. Seperti halnya Layanan R, server ini adalah versi berikutnya dari SQL Server 2016 R Server (Mandiri). Dengan server mandiri, Anda dapat mendistribusikan dan menskalakan solusi R atau Python tanpa dependensi pada SQL Server.
Baru di SQL Server 2016
Rilis ini memperkenalkan kemampuan pembelajaran mesin ke SQL Server melalui SQL Server 2016 R Services, mesin analitik dalam database untuk memproses skrip R pada data penduduk dalam instans mesin database.
Selain itu, SQL Server 2016 R Server (Mandiri) dirilis sebagai cara untuk menginstal R Server di server Windows. Awalnya, Penyiapan SQL Server menyediakan satu-satunya cara untuk menginstal R Server untuk Windows. Dalam rilis selanjutnya, pengembang dan ilmuwan data yang menginginkan R Server di Windows dapat menggunakan alat penginstal mandiri lain untuk mencapai tujuan yang sama. Server mandiri di SQL Server secara fungsional setara dengan produk server mandiri, Microsoft R Server untuk Windows.
Untuk pengumuman fitur all-up, lihat Apa yang Baru di SQL Server 2016.
Lepaskan | Pembaruan fitur |
---|---|
Penambahan CU | Penilaian real time bergantung pada pustaka C++ asli untuk membaca model yang disimpan dalam format biner yang dioptimalkan, lalu menghasilkan prediksi tanpa harus memanggil runtime R. Hal ini membuat operasi penilaian jauh lebih cepat. Dengan penilaian real time, Anda dapat menjalankan prosedur tersimpan atau melakukan penilaian real time dari kode R. Penilaian real time juga tersedia untuk SQL Server 2016, jika instans ditingkatkan ke rilis terbaru Microsoft R Server. |
Rilis awal | Integrasi R untuk analitik dalam database. Paket R untuk memanggil fungsi R di T-SQL, dan sebaliknya. Fungsi RevoScaleR menyediakan analitik R dalam skala besar dengan memotong data ke bagian komponen, mengoordinasikan dan mengelola pemrosesan terdistribusi, dan menggabungkan hasil. Di SQL Server 2016 R Services (In-Database), mesin RevoScaleR terintegrasi dengan instans mesin database, brining data dan analitik bersama-sama dalam konteks pemrosesan yang sama. Integrasi T-SQL dan R melalui sp_execute_external_script. Anda dapat memanggil kode R apa pun menggunakan prosedur tersimpan ini. Infrastruktur aman ini memungkinkan penyebaran model dan skrip Rn tingkat perusahaan yang dapat dipanggil dari aplikasi menggunakan prosedur tersimpan sederhana. Perolehan performa tambahan dicapai oleh data streaming dari proses SQL ke R dan paralelisasi cincin MPI. Anda dapat menggunakan fungsi T-SQL PREDICT untuk melakukan penilaian asli pada model yang telah dilatih sebelumnya yang telah disimpan dalam format biner yang diperlukan. |
Dukungan Linux
SQL Server 2019 menambahkan dukungan Linux untuk R dan Python saat Anda menginstal paket pembelajaran mesin dengan instans mesin database. Untuk informasi selengkapnya, lihat Menginstal SQL Server Pembelajaran Mesin Services di Linux.
Di Linux, SQL Server 2017 tidak memiliki integrasi R atau Python, tetapi Anda dapat menggunakan Penilaian asli di Linux karena fungsionalitas tersebut tersedia melalui T-SQL PREDICT, yang berjalan di Linux. Penilaian asli memungkinkan penilaian performa tinggi dari model yang telah dilatih sebelumnya, tanpa memanggil atau bahkan memerlukan runtime R.