Bagikan melalui


Tutorial Python: Memprediksi sewa ski dengan regresi linier dengan pembelajaran mesin SQL

Berlaku untuk: SQL Server 2017 (14.x) dan Azure SQL Managed Instance yang lebih baru

Dalam seri tutorial empat bagian ini, Anda akan menggunakan regresi Python dan linier di SQL Server Pembelajaran Mesin Services atau di SQL Server 2019 Kluster Big Data untuk memprediksi jumlah penyewaan ski. Tutorial ini menggunakan notebook Python di Azure Data Studio.

Dalam seri tutorial empat bagian ini, Anda akan menggunakan Python dan regresi linier di SQL Server Pembelajaran Mesin Services untuk memprediksi jumlah penyewaan ski. Tutorial ini menggunakan notebook Python di Azure Data Studio.

Dalam seri tutorial empat bagian ini, Anda akan menggunakan regresi Python dan linier di Azure SQL Managed Instance Pembelajaran Mesin Services untuk memprediksi jumlah penyewaan ski. Tutorial ini menggunakan notebook Python di Azure Data Studio.

Bayangkan Anda memiliki bisnis penyewaan ski dan ingin memprediksi jumlah penyewaan yang akan Anda miliki pada tanggal mendatang. Informasi ini membantu Anda menyiapkan stok, staf, dan fasilitas Anda.

Di bagian pertama seri ini, Anda akan disiapkan dengan prasyarat. Di bagian dua dan tiga, Anda akan mengembangkan beberapa skrip Python di notebook untuk menyiapkan data Anda dan melatih model pembelajaran mesin. Kemudian, di bagian ketiga, Anda akan menjalankan skrip Python tersebut di dalam database menggunakan prosedur tersimpan T-SQL.

Dalam artikel ini, Anda akan mempelajari cara:

  • Mengimpor database sampel

Di bagian dua, Anda akan mempelajari cara memuat data dari database ke dalam bingkai data Python, dan menyiapkan data di Python.

Di bagian ketiga, Anda akan mempelajari cara melatih model regresi linier di Python.

Di bagian empat, Anda akan mempelajari cara menyimpan model dalam database, lalu membuat prosedur tersimpan dari skrip Python yang Anda kembangkan di bagian dua dan tiga. Prosedur tersimpan akan berjalan di server untuk membuat prediksi berdasarkan data baru.

Prasyarat

  • Layanan Pembelajaran Mesin SQL Server - Untuk menginstal layanan Pembelajaran Mesin, lihat panduan penginstalan Windows.
  • Azure SQL Managed Instance Pembelajaran Mesin Services - Untuk informasi, lihat gambaran umum Azure SQL Managed Instance Pembelajaran Mesin Services.

  • SQL Server Management Studio (SSMS) - Gunakan SSMS untuk memulihkan database sampel ke Azure SQL Managed Instance. Untuk mengunduh, lihat SQL Server Management Studio.

  • Python IDE - Tutorial ini menggunakan notebook Python di Azure Data Studio. Untuk informasi selengkapnya, lihat Cara menggunakan notebook di Azure Data Studio.

  • Alat kueri SQL - Tutorial ini mengasumsikan Anda menggunakan Azure Data Studio.

  • Paket Python tambahan - Contoh dalam seri tutorial ini menggunakan paket Python berikut yang mungkin tidak diinstal secara default:

    • pandas
    • pyodbc
    • scikit-learn

    Untuk menginstal paket ini:

    1. Di buku catatan Azure Data Studio Anda, pilih Kelola Paket.
    2. Di panel Kelola Paket , pilih tab Tambahkan baru .
    3. Untuk setiap paket berikut, masukkan nama paket, pilih Cari, lalu pilih Instal.

    Sebagai alternatif, Anda dapat membuka Prompt Perintah, mengubah ke jalur penginstalan untuk versi Python yang Anda gunakan di Azure Data Studio (misalnya, cd %LocalAppData%\Programs\Python\Python37-32), lalu menjalankan pip install untuk setiap paket.

Memulihkan database sampel

Database sampel yang digunakan dalam tutorial ini telah disimpan ke .bak file cadangan database untuk Anda unduh dan gunakan.

Catatan

Jika Anda menggunakan Pembelajaran Mesin Services di Kluster Big Data SQL Server 2019, lihat cara Memulihkan database ke dalam instans master kluster big data.

  1. Unduh file TutorialDB.bak.

  2. Ikuti petunjuk dalam Memulihkan database dari file cadangan di Azure Data Studio, menggunakan detail berikut:

    • Impor dari file yang TutorialDB.bak Anda unduh.
    • Beri nama database TutorialDBtarget .
  3. Anda bisa memverifikasi bahwa database yang dipulihkan ada dengan mengkueri dbo.rental_data tabel:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Unduh file TutorialDB.bak.

  2. Ikuti petunjuk dalam Memulihkan database ke Azure SQL Managed Instance di SQL Server Management Studio, menggunakan detail berikut:

    • Impor dari file yang TutorialDB.bak Anda unduh.
    • Beri nama database TutorialDBtarget .
  3. Anda bisa memverifikasi bahwa database yang dipulihkan ada dengan mengkueri dbo.rental_data tabel:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Membersihkan sumber daya

Jika Anda tidak akan melanjutkan tutorial ini, hapus TutorialDB database.

Langkah selanjutnya

Di bagian salah satu seri tutorial ini, Anda menyelesaikan langkah-langkah berikut:

  • Menginstal prasyarat
  • Mengimpor database sampel

Untuk menyiapkan data dari database TutorialDB, ikuti bagian dua dari seri tutorial ini: