Tutorial: Mengembangkan model prediktif di R dengan pembelajaran mesin SQL
Berlaku untuk: SQL Server 2016 (13.x) dan yang lebih baru Azure SQL Managed Instance
Dalam seri tutorial empat bagian ini, Anda akan menggunakan R dan model pembelajaran mesin di SQL Server Machine Learning Services atau di Kluster Big Data untuk memprediksi jumlah penyewaan ski.
Dalam seri tutorial empat bagian ini, Anda akan menggunakan R dan model pembelajaran mesin di SQL Server Machine Learning Services untuk memprediksi jumlah penyewaan ski.
Dalam seri tutorial empat bagian ini, Anda akan menggunakan R dan model pembelajaran mesin di SQL Server R Services untuk memprediksi jumlah penyewaan ski.
Dalam seri tutorial empat bagian ini, Anda akan menggunakan R dan model pembelajaran mesin di Azure SQL Managed Instance Machine Learning Services untuk memprediksi jumlah penyewaan ski.
Bayangkan Anda memiliki bisnis penyewaan ski dan Anda ingin memprediksi jumlah penyewaan yang akan Anda miliki pada tanggal mendatang. Informasi ini akan membantu Anda menyiapkan stok, staf, dan fasilitas Anda.
Di bagian pertama seri ini, Anda akan disiapkan dengan prasyarat. Di bagian dua dan tiga, Anda akan mengembangkan beberapa skrip R dalam buku catatan untuk menyiapkan data Anda dan melatih model pembelajaran mesin. Kemudian, di bagian tiga, Anda akan menjalankan skrip R tersebut di dalam database menggunakan prosedur tersimpan T-SQL.
Dalam artikel ini, Anda akan mempelajari cara:
- Memulihkan database sampel
Di bagian dua, Anda akan mempelajari cara memuat data dari database ke dalam bingkai data Python, dan menyiapkan data di R.
Di bagian tiga, Anda akan mempelajari cara melatih model model pembelajaran mesin di R.
Di bagian empat, Anda akan mempelajari cara menyimpan model dalam database, lalu membuat prosedur tersimpan dari skrip R yang Anda kembangkan di bagian dua dan tiga. Prosedur tersimpan akan berjalan di server untuk membuat prediksi berdasarkan data baru.
Prasyarat
- SQL Server Layanan Pembelajaran Mesin - Untuk menginstal Layanan Pembelajaran Mesin, lihat panduan penginstalan Windows atau panduan penginstalan Linux. Anda juga dapat mengaktifkan Layanan Pembelajaran Mesin di SQL Server Kluster Big Data.
- SQL Server Layanan Pembelajaran Mesin - Untuk menginstal Layanan Pembelajaran Mesin, lihat panduan penginstalan Windows.
- SQL Server 2016 R Services. Untuk menginstal R Services, lihat panduan penginstalan Windows.
Azure SQL Managed Instance Layanan Pembelajaran Mesin. Untuk informasi, lihat ringkasan Azure SQL Managed Instance Machine Learning Services.
SQL Server Management Studio untuk memulihkan database sampel ke Azure SQL Managed Instance.
R IDE - Tutorial ini menggunakan RStudio Desktop.
RODBC - Driver ini digunakan dalam skrip R yang akan Anda kembangkan dalam tutorial ini. Jika belum diinstal, instal menggunakan perintah
install.packages("RODBC")
R . Untuk informasi selengkapnya tentang RODBC, lihat CRAN - Package RODBC.Alat kueri SQL - Tutorial ini mengasumsikan Anda menggunakan Azure Data Studio. Untuk informasi selengkapnya, lihat Cara menggunakan buku catatan di Azure Data Studio.
Memulihkan database sampel
Database sampel yang digunakan dalam tutorial ini telah disimpan ke file cadangan database .bak untuk Anda unduh dan gunakan.
Catatan
Jika Anda menggunakan Layanan Pembelajaran Mesin di Kluster Big Data, lihat cara Memulihkan database ke dalam instans master kluster big data SQL Server.
Unduh file TutorialDB.bak.
Ikuti petunjuk dalam Memulihkan database dari file cadangan di Azure Data Studio, menggunakan detail berikut:
- Impor dari file TutorialDB.bak yang Anda unduh
- Beri nama database target "TutorialDB"
Anda bisa memverifikasi bahwa database yang dipulihkan ada dengan mengkueri tabel dbo.rental_data :
USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Unduh file TutorialDB.bak.
Ikuti petunjuk dalam Memulihkan database ke Instans Terkelola di SQL Server Management Studio, menggunakan detail berikut:
- Impor dari file TutorialDB.bak yang Anda unduh
- Beri nama database target "TutorialDB"
Anda bisa memverifikasi bahwa database yang dipulihkan ada dengan mengkueri tabel dbo.rental_data :
USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Membersihkan sumber daya
Jika Anda tidak akan melanjutkan tutorial ini, hapus database TutorialDB.
Langkah berikutnya
Di bagian salah satu seri tutorial ini, Anda menyelesaikan langkah-langkah berikut:
- Menginstal prasyarat
- Memulihkan database sampel
Untuk menyiapkan data untuk model pembelajaran mesin, ikuti bagian dua dari seri tutorial ini:
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk