Udostępnij za pomocą


Samouczek języka Python: przewidywanie wypożyczania nart przy użyciu regresji liniowej za pomocą uczenia maszynowego SQL

Dotyczy: SQL Server 2017 (14.x) i nowsze wersje usługi Azure SQL Managed Instance

W tej czteroczęściowej serii samouczków użyjesz języka Python i regresji liniowej w usługach SQL Server Machine Learning Services lub w klastrach danych big data programu SQL Server 2019 , aby przewidzieć liczbę wypożyczeń narciarskich. W tym samouczku jest używany notes języka Python w narzędziu Azure Data Studio.

W tej czteroczęściowej serii samouczków użyjesz języka Python i regresji liniowej w usługach SQL Server Machine Learning Services , aby przewidzieć liczbę wypożyczeń narciarskich. W tym samouczku jest używany notes języka Python w narzędziu Azure Data Studio.

W tej czteroczęściowej serii samouczków użyjesz języka Python i regresji liniowej w usługach Azure SQL Managed Instance Machine Learning Services , aby przewidzieć liczbę wypożyczeń narciarskich. W tym samouczku jest używany notes języka Python w narzędziu Azure Data Studio.

Wyobraź sobie, że jesteś właścicielem firmy wypożyczania nart i chcesz przewidzieć liczbę wypożyczeń, które będziesz mieć w przyszłości. Te informacje ułatwiają przygotowanie zapasów, pracowników i obiektów.

W pierwszej części tej serii zajmiesz się przygotowaniem wymagań wstępnych do rozpoczęcia pracy. W dwóch i trzech częściach utworzysz kilka skryptów języka Python w notesie, aby przygotować dane i wytrenować model uczenia maszynowego. Następnie w trzeciej części uruchomisz te skrypty języka Python w bazie danych przy użyciu procedur składowanych języka T-SQL.

W tym artykule dowiesz się, jak:

  • Importowanie przykładowej bazy danych

W drugiej części dowiesz się, jak załadować dane z bazy danych do ramki danych języka Python i przygotować dane w języku Python.

W trzeciej części dowiesz się, jak wytrenować model regresji liniowej w języku Python.

W czwartej części dowiesz się, jak przechowywać model w bazie danych, a następnie utworzyć procedury składowane na podstawie skryptów języka Python utworzonych w częściach 2 i trzech. Procedury składowane będą uruchamiane na serwerze w celu przewidywania na podstawie nowych danych.

Wymagania wstępne

  • Środowisko IDE języka Python — ten samouczek korzysta z notesu języka Python w narzędziu Azure Data Studio. Aby uzyskać więcej informacji, zobacz How to use notebooks in Azure Data Studio (Jak używać notesów w narzędziu Azure Data Studio).

  • Narzędzie zapytań SQL — w tym samouczku założono, że używasz narzędzia Azure Data Studio.

  • Dodatkowe pakiety języka Python — przykłady z tej serii samouczków używają następujących pakietów języka Python, które mogą nie być instalowane domyślnie:

    • Pandas
    • pyodbc
    • scikit-learn

    Aby zainstalować te pakiety:

    1. W notesie usługi Azure Data Studio wybierz pozycję Zarządzaj pakietami.
    2. W okienku Zarządzanie pakietami wybierz kartę Dodaj nową .
    3. Dla każdego z poniższych pakietów wprowadź nazwę pakietu, wybierz pozycję Wyszukaj, a następnie wybierz pozycję Zainstaluj.

    Alternatywnie możesz otworzyć wiersz polecenia, zmienić ścieżkę instalacji na wersję języka Python używaną w narzędziu Azure Data Studio (na przykład cd %LocalAppData%\Programs\Python\Python37-32), a następnie uruchomić pip install dla każdego pakietu.

Przywracanie przykładowej bazy danych

Przykładowa baza danych używana w tym samouczku została zapisana w .bak pliku kopii zapasowej bazy danych do pobrania i użycia.

Uwaga / Notatka

Jeśli używasz usług Machine Learning Services w klastrach danych big data programu SQL Server 2019, zobacz, jak przywrócić bazę danych do wystąpienia głównego klastra danych big data.

  1. Pobierz plik TutorialDB.bak.

  2. Postępuj zgodnie z instrukcjami w artykule Przywracanie bazy danych z pliku kopii zapasowej w narzędziu Azure Data Studio, korzystając z następujących szczegółów:

    • Zaimportuj z pobranego TutorialDB.bak pliku.
    • Nadaj docelowej bazie danych TutorialDBnazwę .
  3. Możesz sprawdzić, czy przywrócona baza danych istnieje, wykonując dbo.rental_data zapytanie dotyczące tabeli:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Pobierz plik TutorialDB.bak.

  2. Postępuj zgodnie z instrukcjami w artykule Przywracanie bazy danych do usługi Azure SQL Managed Instance w programie SQL Server Management Studio, korzystając z następujących szczegółów:

    • Zaimportuj z pobranego TutorialDB.bak pliku.
    • Nadaj docelowej bazie danych TutorialDBnazwę .
  3. Możesz sprawdzić, czy przywrócona baza danych istnieje, wykonując dbo.rental_data zapytanie dotyczące tabeli:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Uprzątnij zasoby

Jeśli nie zamierzasz kontynuować pracy z tym samouczkiem, usuń TutorialDB bazę danych.

Następny krok

W jednej części tej serii samouczków wykonano następujące kroki:

  • Zainstalowano niezbędne składniki
  • Importowanie przykładowej bazy danych

Aby przygotować dane z bazy danych TutorialDB, wykonaj drugą część tej serii samouczków: