Apa yang baru dalam SQL Server Machine Learning Services?

Berlaku untuk: SQL Server 2016 (13.x) dan yang lebih baru

Artikel ini menjelaskan kemampuan dan fitur baru apa yang disertakan dalam setiap versi SQL Server Machine Learning Services. Kemampuan pembelajaran mesin ditambahkan ke SQL Server di setiap rilis saat kami terus memperluas, memperluas, dan memperdalam integrasi antara platform data, analitik tingkat lanjut, dan ilmu data.

Catatan

Kemampuan fitur dan opsi penginstalan bervariasi di antara versi SQL Server. Gunakan menu dropdown pemilih versi untuk memilih versi SQL Server yang sesuai.

Baru di SQL Server 2022

Dimulai dengan Pratinjau SQL Server 2022 (16.x), runtime untuk R, Python, dan Java, tidak lagi diinstal dengan Penyiapan SQL. Sebagai gantinya, instal runtime dan paket kustom yang diinginkan. Untuk informasi selengkapnya, lihat Menginstal SQL Server 2022 Machine Learning Services (Python dan R) di Windows atau Menginstal SQL Server Machine Learning Services (Python dan R) di Linux.

Baru di SQL Server 2019

Rilis ini menambahkan fitur yang diminta teratas untuk operasi pembelajaran mesin Python dan R di SQL Server. Untuk informasi selengkapnya tentang semua fitur dalam rilis ini, lihat Apa yang Baru di SQL Server 2019 dan Catatan Rilis untuk SQL Server 2019.

Untuk dokumentasi baru tentang Java dan C# di SQL Server 2019, lihat Apa yang baru dalam Ekstensi Bahasa SQL Server?.

Di bawah ini adalah fitur baru untuk SQL Server Machine Learning Services, tersedia di Windows dan Linux:

Baru di SQL Server 2017

Rilis ini menambahkan dukungan Python dan algoritma pembelajaran mesin terkemuka di industri. Diganti namanya untuk mencerminkan cakupan baru, SQL Server 2017 menandai pengenalan SQL Server Machine Learning Services (Dalam Database), dengan dukungan bahasa untuk Python dan R.

Untuk pengumuman fitur all-up, lihat Apa yang Baru di SQL Server 2017.

Penyempurnaan R

Komponen R dari SQL Server Machine Learning Services adalah generasi berikutnya dari SQL Server 2016 R Services, dengan versi terbaru dari R dasar, RevoScaler, dan paket lainnya.

Kemampuan baru untuk R mencakup manajemen paket, dengan sorotan berikut:

Pustaka R

Paket Deskripsi
MicrosoftML Dalam rilis ini, MicrosoftML disertakan dalam penginstalan R default, menghilangkan langkah peningkatan yang diperlukan di Layanan R SQL Server 2016 sebelumnya. MicrosoftML menyediakan algoritma pembelajaran mesin canggih dan transformasi data yang dapat diskalakan atau dijalankan dalam konteks komputasi jarak jauh. Algoritma termasuk jaringan neural dalam yang dapat disesuaikan, pohon keputusan dan hutan keputusan yang cepat, regresi linier, dan regresi logistik.

Integrasi Python untuk analitik dalam database

Python adalah bahasa yang menawarkan fleksibilitas dan daya yang besar untuk berbagai tugas pembelajaran mesin. Pustaka sumber terbuka untuk Python mencakup beberapa platform untuk jaringan neural yang dapat disesuaikan, serta pustaka populer untuk pemrosesan bahasa alami.

Karena Python terintegrasi dengan mesin database, Anda dapat menjaga analitik tetap dekat dengan data dan menghilangkan biaya dan risiko keamanan yang terkait dengan pergerakan data. Anda dapat menyebarkan solusi pembelajaran mesin berdasarkan Python menggunakan alat seperti Visual Studio. Aplikasi produksi Anda bisa mendapatkan prediksi, model, atau visual dari runtime Python 3.5 menggunakan metode akses data SQL Server.

Integrasi T-SQL dan Python didukung melalui prosedur tersimpan sistem sp_execute_external_script . Anda dapat memanggil kode Python apa pun menggunakan prosedur tersimpan ini. Kode berjalan dalam arsitektur ganda yang aman yang memungkinkan penyebaran model dan skrip Python tingkat perusahaan, dapat dipanggil dari aplikasi menggunakan prosedur tersimpan sederhana. Perolehan performa tambahan dicapai oleh data streaming dari proses SQL ke Python dan paralelisasi cincin MPI.

Anda dapat menggunakan fungsi T-SQL PREDICT untuk melakukan penilaian asli pada model yang telah dilatih sebelumnya yang telah disimpan dalam format biner yang diperlukan.

Pustaka Python

Paket Deskripsi
revoscalepy Python-setara dengan RevoScaleR. Anda dapat membuat model Python untuk regresi linier dan logistik, pohon keputusan, pohon yang ditingkatkan, dan hutan acak, semua dapat diparalelkan, dan mampu dijalankan dalam konteks komputasi jarak jauh. Paket ini mendukung penggunaan beberapa sumber data dan konteks komputasi jarak jauh. Ilmuwan atau pengembang data dapat menjalankan kode Python pada SQL Server jarak jauh, untuk menjelajahi data atau membangun model tanpa memindahkan data.
microsoftml Python-setara dengan paket MicrosoftML R.

Model yang sudah dilatih sebelumnya

Model pra-terlatih tersedia untuk Python dan R. Gunakan model ini untuk pengenalan gambar dan analisis sentimen positif-negatif, untuk menghasilkan prediksi pada data Anda sendiri.

Server Mandiri sebagai fitur bersama dalam Penyetelan SQL Server

Rilis ini juga menambahkan SQL Server Machine Learning Server (Standalone), server ilmu data yang sepenuhnya independen, mendukung analitik statistik dan prediktif di R dan Python. Seperti halnya Layanan R, server ini adalah versi berikutnya dari SQL Server 2016 R Server (Mandiri). Dengan server mandiri, Anda dapat mendistribusikan dan menskalakan solusi R atau Python tanpa dependensi pada SQL Server.

Baru di SQL Server 2016

Rilis ini memperkenalkan kemampuan pembelajaran mesin ke dalam SQL Server melalui SQL Server 2016 R Services, mesin analitik dalam database untuk memproses skrip R pada data penduduk dalam instans mesin database.

Selain itu, SQL Server 2016 R Server (Mandiri) dirilis sebagai cara untuk menginstal R Server di server Windows. Awalnya, penyiapan SQL Server menyediakan satu-satunya cara untuk menginstal R Server untuk Windows. Dalam rilis selanjutnya, pengembang dan ilmuwan data yang menginginkan R Server di Windows dapat menggunakan alat penginstal mandiri lain untuk mencapai tujuan yang sama. Server mandiri di SQL Server secara fungsional setara dengan produk server mandiri, Microsoft R Server untuk Windows.

Untuk pengumuman fitur all-up, lihat Apa yang Baru di SQL Server 2016.

Rilis Pembaruan fitur
Penambahan CU Penilaian real time bergantung pada pustaka C++ asli untuk membaca model yang disimpan dalam format biner yang dioptimalkan, lalu menghasilkan prediksi tanpa harus memanggil runtime R. Hal ini membuat operasi penilaian jauh lebih cepat. Dengan penilaian real-time, Anda dapat menjalankan prosedur tersimpan atau melakukan penilaian real time dari kode R. Penilaian real time juga tersedia untuk SQL Server 2016, jika instans ditingkatkan ke rilis terbaru Microsoft R Server.
Rilis awal Integrasi R untuk analitik dalam database.

Paket R untuk memanggil fungsi R di T-SQL, dan sebaliknya. Fungsi RevoScaleR menyediakan analitik R dalam skala besar dengan memotong data ke dalam bagian komponen, mengoordinasikan dan mengelola pemrosesan terdistribusi, dan menggabungkan hasil. Dalam SQL Server 2016 R Services (Dalam Database), mesin RevoScaleR terintegrasi dengan instans mesin database, brining data dan analitik bersama-sama dalam konteks pemrosesan yang sama.

Integrasi T-SQL dan R melalui sp_execute_external_script. Anda dapat memanggil kode R apa pun menggunakan prosedur tersimpan ini. Infrastruktur aman ini memungkinkan penyebaran model dan skrip Rn tingkat perusahaan yang dapat dipanggil dari aplikasi menggunakan prosedur tersimpan sederhana. Perolehan performa tambahan dicapai dengan streaming data dari proses SQL ke R dan paralelisasi cincin MPI.

Anda dapat menggunakan fungsi T-SQL PREDICT untuk melakukan penilaian asli pada model yang telah dilatih sebelumnya yang telah disimpan dalam format biner yang diperlukan.

Dukungan Linux

SQL Server 2019 menambahkan dukungan Linux untuk R dan Python saat Anda menginstal paket pembelajaran mesin dengan instans mesin database. Untuk informasi selengkapnya, lihat Menginstal SQL Server Machine Learning Services di Linux.

Di Linux, SQL Server 2017 tidak memiliki integrasi R atau Python, tetapi Anda dapat menggunakan Penilaian asli di Linux karena fungsionalitas tersebut tersedia melalui T-SQL PREDICT, yang berjalan di Linux. Penilaian asli memungkinkan penilaian performa tinggi dari model yang telah dilatih sebelumnya, tanpa memanggil atau bahkan memerlukan runtime R.

Langkah berikutnya