Python-Tutorial: Vorhersagen, wie viele Ski verliehen werden, mithilfe linearer Regression mit SQL Machine Learning

Gilt für: SQL Server 2017 (14.x) und höher Azure SQL Managed Instance

In diesem vierteiligen Tutorial verwenden Sie Python und die lineare Regression in SQL Server-Machine Learning Services oder in SQL Server 2019 Big Data-Clustern zur Vorhersage der Verleihzahlen für einen Skiverleih. In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.

In diesem vierteiligen Tutorial verwenden Sie Python und die lineare Regression in SQL Server-Machine Learning Services zur Vorhersage von Verleihzahlen für einen Skiverleih. In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.

In dieser vierteiligen Tutorialreihe verwenden Sie Python und lineare Regression in Machine Learning Services in Azure SQL Managed Instance zur Vorhersage von Verleihzahlen für einen Skiverleih. In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.

Angenommen, Sie möchten für Ihren eigenen Skiverleih die Verleihzahlen für einen bestimmten Zeitpunkt in der Zukunft vorhersagen. Mit dieser Information können Sie den Bestand, die Mitarbeiter und die Räumlichkeiten besser vorausplanen.

Im ersten Teil der Reihe bereiten Sie die Voraussetzungen vor. Im zweiten und dritten Teil entwickeln Sie Python-Skripts in einem Notebook zur Vorbereitung Ihrer Daten und zum Trainieren eines Machine Learning-Modells. In Teil 3 führen Sie diese Python-Skripts dann in der Datenbank mithilfe von gespeicherten T-SQL-Prozeduren aus.

In diesem Artikel lernen Sie Folgendes:

  • Importieren einer Beispieldatenbank

In Teil 2 lernen Sie, wie Sie die Daten aus einer Datenbank in einen Python-Datenrahmen laden und in Python vorbereiten.

In Teil 3 trainieren Sie ein lineares Regressionsmodell in Python.

In Teil 4 haben Sie gelernt, wie Sie das Modell in einer Datenbank speichern und gespeicherte Prozeduren aus den Python-Skripts erstellen, die Sie in Teil 2 und 3 entwickelt haben. Die gespeicherten Prozeduren werden auf dem Server ausgeführt, um Vorhersagen basierend auf neuen Daten treffen zu können.

Voraussetzungen

  • Python-IDE: In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet. Weitere Informationen finden Sie unter Verwenden von Notebooks in Azure Data Studio.

  • SQL-Abfragetool: In diesem Tutorial wird davon ausgegangen, dass Sie Azure Data Studio verwenden.

  • Weitere Python-Pakete: In den Beispielen in dieser Tutorialreihe werden die folgenden Python-Pakete verwendet, die möglicherweise nicht standardmäßig installiert sind:

    • pandas
    • pyodbc
    • sklearn

    Installieren Sie diese Pakete wie folgt:

    1. Klicken Sie in Ihrem Azure Data Studio-Notebook auf die Option Pakete verwalten.
    2. Klicken Sie dann im Bereich Manage Packages (Pakete verwalten) auf die Registerkarte Add new (Neue hinzufügen).
    3. Geben Sie für jedes der folgenden Pakete den jeweiligen Paketnamen ein, wählen Sie Suchen und dann Installieren.

    Alternativ können Sie eine Eingabeaufforderung öffnen, zum Installationspfad für die Python-Version wechseln, die Sie in Azure Data Studio verwenden, (z. B. cd %LocalAppData%\Programs\Python\Python37-32) und dann für jedes Paket pip install ausführen.

Wiederherstellen der Beispieldatenbank

Die in diesem Tutorial verwendete Beispieldatenbank wurde in einer BAK-Datenbanksicherungsdatei gespeichert, die Sie herunterladen und verwenden können.

Hinweis

Wenn Sie Machine Learning Services in SQL Server 2019 Big Data-Clustern verwenden, finden Sie Informationen zum Wiederherstellen unter Wiederherstellen einer Datenbank in der Masterinstanz eines Big Data-Clusters.

  1. Laden Sie die Datei TutorialDB.bak herunter.

  2. Befolgen Sie die Anweisungen unter Wiederherstellen einer Datenbank aus einer Sicherungsdatei in Azure Data Studio, und verwenden Sie hierzu die folgenden Details:

    • Importieren Sie aus der heruntergeladenen Datei TutorialDB.bak.
    • Benennen Sie die Zieldatenbank TutorialDB.
  3. Sie können überprüfen, ob die wiederhergestellte Datenbank bereits vorhanden ist, indem Sie die dbo.rental_data Tabelle abfragen:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Laden Sie die Datei TutorialDB.bak herunter.

  2. Befolgen Sie die Anweisungen unter Wiederherstellen einer Datenbank in Azure SQL Managed Instance in SQL Server Management Studio. Verwenden Sie hierzu die folgenden Details:

    • Importieren Sie aus der heruntergeladenen Datei TutorialDB.bak.
    • Benennen Sie die Zieldatenbank TutorialDB.
  3. Sie können überprüfen, ob die wiederhergestellte Datenbank bereits vorhanden ist, indem Sie die dbo.rental_data Tabelle abfragen:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Bereinigen von Ressourcen

Wenn Sie nicht mit diesem Tutorial fortfahren möchten, löschen Sie die TutorialDB Datenbank.

Nächste Schritte

Im ersten Teil dieser Tutorialreihe haben Sie die folgenden Schritte ausgeführt:

  • Installieren der Voraussetzungen
  • Importieren einer Beispieldatenbank

Fahren Sie mit Teil 2 dieser Tutorialreihe fort, um die Daten aus der Datenbank „TutorialDB“ vorzubereiten: