Tutorial Python: Memprediksi penyewaan ski dengan regresi linier dengan pembelajaran mesin SQL

Berlaku untuk: SQL Server 2017 (14.x) dan yang lebih baru Azure SQL Managed Instance

Dalam seri tutorial empat bagian ini, Anda akan menggunakan Python dan regresi linier di SQL Server Machine Learning Services atau pada SQL Server 2019 Kluster Big Data untuk memprediksi jumlah penyewaan ski. Tutorial ini menggunakan notebook Python di Azure Data Studio.

Dalam seri tutorial empat bagian ini, Anda akan menggunakan Python dan regresi linier di SQL Server Machine Learning Services untuk memprediksi jumlah penyewaan ski. Tutorial ini menggunakan notebook Python di Azure Data Studio.

Dalam seri tutorial empat bagian ini, Anda akan menggunakan Python dan regresi linier di Azure SQL Managed Instance Machine Learning Services untuk memprediksi jumlah penyewaan ski. Tutorial ini menggunakan notebook Python di Azure Data Studio.

Bayangkan Anda memiliki bisnis penyewaan ski dan ingin memprediksi jumlah penyewaan yang akan Anda miliki pada tanggal mendatang. Informasi ini akan membantu Anda menyiapkan stok, staf, dan fasilitas Anda.

Di bagian pertama seri ini, Anda akan menyiapkan prasyarat. Di bagian dua dan tiga, Anda akan mengembangkan beberapa skrip Python dalam buku catatan untuk menyiapkan data Anda dan melatih model pembelajaran mesin. Kemudian, di bagian ketiga, Anda akan menjalankan skrip Python tersebut di dalam database menggunakan prosedur tersimpan T-SQL.

Dalam artikel ini, Anda akan mempelajari cara:

  • Mengimpor database sampel

Di bagian dua, Anda akan mempelajari cara memuat data dari database ke dalam bingkai data Python, dan menyiapkan data di Python.

Di bagian ketiga, Anda akan mempelajari cara melatih model regresi linier di Python.

Di bagian empat, Anda akan mempelajari cara menyimpan model dalam database, lalu membuat prosedur tersimpan dari skrip Python yang Anda kembangkan di bagian dua dan tiga. Prosedur tersimpan akan berjalan di server untuk membuat prediksi berdasarkan data baru.

Prasyarat

  • Python IDE - Tutorial ini menggunakan buku catatan Python di Azure Data Studio. Untuk informasi selengkapnya, lihat Cara menggunakan buku catatan di Azure Data Studio.

  • Alat kueri SQL - Tutorial ini mengasumsikan Anda menggunakan Azure Data Studio.

  • Paket Python tambahan - Contoh dalam seri tutorial ini menggunakan paket Python berikut yang mungkin tidak diinstal secara default:

    • pandas
    • pyodbc
    • sklearn

    Untuk menginstal paket ini:

    1. Di buku catatan Azure Data Studio Anda, pilih Kelola Paket.
    2. Di panel Kelola Paket , pilih tab Tambahkan baru .
    3. Untuk setiap paket berikut, masukkan nama paket, pilih Cari, lalu pilih Instal.

    Sebagai alternatif, Anda dapat membuka Prompt Perintah, mengubah ke jalur penginstalan untuk versi Python yang Anda gunakan di Azure Data Studio (misalnya, cd %LocalAppData%\Programs\Python\Python37-32), lalu jalankan pip install untuk setiap paket.

Memulihkan database sampel

Database sampel yang digunakan dalam tutorial ini telah disimpan ke file cadangan database .bak agar Anda dapat mengunduh dan menggunakannya.

Catatan

Jika Anda menggunakan Layanan Pembelajaran Mesin pada Kluster Big Data SQL Server 2019, lihat cara Memulihkan database ke dalam instans master kluster big data.

  1. Unduh file TutorialDB.bak.

  2. Ikuti petunjuk dalam Memulihkan database dari file cadangan di Azure Data Studio, menggunakan detail berikut:

    • Impor dari file yang TutorialDB.bak Anda unduh.
    • Beri nama database TutorialDBtarget .
  3. Anda bisa memverifikasi bahwa database yang dipulihkan ada dengan mengkueri dbo.rental_data tabel:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Unduh file TutorialDB.bak.

  2. Ikuti petunjuk dalam Memulihkan database untuk Azure SQL Managed Instance di SQL Server Management Studio, menggunakan detail berikut:

    • Impor dari file yang TutorialDB.bak Anda unduh.
    • Beri nama database TutorialDBtarget .
  3. Anda bisa memverifikasi bahwa database yang dipulihkan ada dengan mengkueri dbo.rental_data tabel:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Membersihkan sumber daya

Jika Anda tidak akan melanjutkan tutorial ini, hapus TutorialDB database.

Langkah berikutnya

Di bagian salah satu seri tutorial ini, Anda menyelesaikan langkah-langkah berikut:

  • Menginstal prasyarat
  • Mengimpor database sampel

Untuk menyiapkan data dari database TutorialDB, ikuti bagian dua dari seri tutorial ini: