Tutorial: Mengembangkan model prediktif di R dengan pembelajaran mesin SQL
Berlaku untuk: SQL Server 2016 (13.x) dan Azure SQL Managed Instance yang lebih baru
Dalam seri tutorial empat bagian ini, Anda menggunakan R dan model pembelajaran mesin di SQL Server Pembelajaran Mesin Services atau di Kluster Big Data untuk memprediksi jumlah penyewaan ski.
Dalam seri tutorial empat bagian ini, Anda menggunakan R dan model pembelajaran mesin di SQL Server Pembelajaran Mesin Services untuk memprediksi jumlah penyewaan ski.
Dalam seri tutorial empat bagian ini, Anda menggunakan R dan model pembelajaran mesin di SQL Server R Services untuk memprediksi jumlah penyewaan ski.
Dalam seri tutorial empat bagian ini, Anda menggunakan R dan model pembelajaran mesin di Azure SQL Managed Instance Pembelajaran Mesin Services untuk memprediksi jumlah penyewaan ski.
Bayangkan Anda memiliki bisnis penyewaan ski dan ingin memprediksi jumlah penyewaan yang akan Anda miliki pada tanggal mendatang. Informasi ini akan membantu Anda menyiapkan stok, staf, dan fasilitas Anda.
Di bagian pertama seri ini, Anda akan disiapkan dengan prasyarat. Di bagian dua dan tiga, Anda akan mengembangkan beberapa skrip R dalam buku catatan untuk menyiapkan data Anda dan melatih model pembelajaran mesin. Kemudian, di bagian ketiga, Anda akan menjalankan skrip R tersebut di dalam database menggunakan prosedur tersimpan T-SQL.
Dalam artikel ini, Anda akan mempelajari cara:
- Memulihkan database sampel
Di bagian dua, Anda akan mempelajari cara memuat data dari database ke dalam bingkai data Python, dan menyiapkan data di R.
Di bagian tiga, Anda akan mempelajari cara melatih model pembelajaran mesin di R.
Di bagian empat, Anda akan mempelajari cara menyimpan model dalam database, lalu membuat prosedur tersimpan dari skrip R yang Anda kembangkan di bagian dua dan tiga. Prosedur tersimpan berjalan di server untuk membuat prediksi berdasarkan data baru.
Prasyarat
- Layanan Pembelajaran Mesin SQL Server - Untuk menginstal Layanan Pembelajaran Mesin, lihat panduan penginstalan Windows atau panduan penginstalan Linux. Anda juga dapat mengaktifkan Layanan Pembelajaran Mesin di Kluster Big Data SQL Server.
- Layanan Pembelajaran Mesin SQL Server - Untuk menginstal layanan Pembelajaran Mesin, lihat panduan penginstalan Windows.
- Layanan SQL Server 2016 R - Untuk menginstal Layanan R, lihat panduan penginstalan Windows.
Azure SQL Managed Instance Pembelajaran Mesin Services. Untuk informasi, lihat gambaran umum Azure SQL Managed Instance Pembelajaran Mesin Services.
SQL Server Management Studio (SSMS) - Gunakan SSMS untuk memulihkan database sampel ke Azure SQL Managed Instance. Untuk mengunduh, lihat SQL Server Management Studio.
R IDE - Tutorial ini menggunakan RStudio Desktop.
RODBC - Driver ini digunakan dalam skrip R yang Anda kembangkan dalam tutorial ini. Jika belum diinstal, instal menggunakan perintah
install.packages("RODBC")
R . Untuk informasi selengkapnya tentang RODBC, lihat CRAN - Package RODBC.Alat kueri SQL - Tutorial ini mengasumsikan Anda menggunakan Azure Data Studio. Untuk informasi selengkapnya, lihat Cara menggunakan notebook di Azure Data Studio.
Memulihkan database sampel
Database sampel yang digunakan dalam tutorial ini telah disimpan ke .bak
file cadangan database untuk Anda unduh dan gunakan.
Catatan
Jika Anda menggunakan Pembelajaran Mesin Services di Kluster Big Data, lihat cara Memulihkan database ke dalam instans master kluster big data SQL Server.
Unduh file TutorialDB.bak.
Ikuti petunjuk dalam Memulihkan database dari file cadangan di Azure Data Studio, menggunakan detail berikut:
- Impor dari file yang
TutorialDB.bak
Anda unduh. - Beri nama database
TutorialDB
target .
- Impor dari file yang
Anda bisa memverifikasi bahwa database yang dipulihkan ada dengan mengkueri
dbo.rental_data
tabel:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Unduh file TutorialDB.bak.
Ikuti petunjuk dalam Memulihkan database ke Azure SQL Managed Instance di SQL Server Management Studio, menggunakan detail berikut:
- Impor dari file yang
TutorialDB.bak
Anda unduh. - Beri nama database
TutorialDB
target .
- Impor dari file yang
Anda bisa memverifikasi bahwa database yang dipulihkan ada dengan mengkueri
dbo.rental_data
tabel:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Membersihkan sumber daya
Jika Anda tidak akan melanjutkan tutorial ini, hapus database TutorialDB.
Langkah selanjutnya
Di bagian salah satu seri tutorial ini, Anda menyelesaikan langkah-langkah berikut:
- Menginstal prasyarat
- Memulihkan database sampel
Untuk menyiapkan data untuk model pembelajaran mesin, ikuti bagian dua dari seri tutorial ini:
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk