Python-Tutorial: Vorhersagen, wie viele Ski verliehen werden, mithilfe linearer Regression mit SQL Machine Learning
Gilt für: SQL Server 2017 (14.x) und höher Azure SQL Managed Instance
In diesem vierteiligen Tutorial verwenden Sie Python und die lineare Regression in SQL Server-Machine Learning Services oder in SQL Server 2019 Big Data-Clustern zur Vorhersage der Verleihzahlen für einen Skiverleih. In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.
In diesem vierteiligen Tutorial verwenden Sie Python und die lineare Regression in SQL Server-Machine Learning Services zur Vorhersage von Verleihzahlen für einen Skiverleih. In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.
In dieser vierteiligen Tutorialreihe verwenden Sie Python und lineare Regression in Machine Learning Services in Azure SQL Managed Instance zur Vorhersage von Verleihzahlen für einen Skiverleih. In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet.
Angenommen, Sie möchten für Ihren eigenen Skiverleih die Verleihzahlen für einen bestimmten Zeitpunkt in der Zukunft vorhersagen. Mit dieser Information können Sie den Bestand, die Mitarbeiter und die Räumlichkeiten besser vorausplanen.
Im ersten Teil der Reihe bereiten Sie die Voraussetzungen vor. Im zweiten und dritten Teil entwickeln Sie Python-Skripts in einem Notebook zur Vorbereitung Ihrer Daten und zum Trainieren eines Machine Learning-Modells. In Teil 3 führen Sie diese Python-Skripts dann in der Datenbank mithilfe von gespeicherten T-SQL-Prozeduren aus.
In diesem Artikel lernen Sie Folgendes:
- Importieren einer Beispieldatenbank
In Teil 2 lernen Sie, wie Sie die Daten aus einer Datenbank in einen Python-Datenrahmen laden und in Python vorbereiten.
In Teil 3 trainieren Sie ein lineares Regressionsmodell in Python.
In Teil 4 haben Sie gelernt, wie Sie das Modell in einer Datenbank speichern und gespeicherte Prozeduren aus den Python-Skripts erstellen, die Sie in Teil 2 und 3 entwickelt haben. Die gespeicherten Prozeduren werden auf dem Server ausgeführt, um Vorhersagen basierend auf neuen Daten treffen zu können.
Voraussetzungen
- SQL Server Machine Learning Services: Informationen zur Installation von Machine Learning Services finden Sie im Windows-Installationsleitfaden oder im Linux-Installationsleitfaden. Sie können auch Machine Learning Services in SQL Server 2019 Big Data-Clustern aktivieren.
- SQL Server-Machine Learning Services: Informationen zur Installation von Machine Learning Services finden Sie im Windows-Installationsleitfaden.
Azure SQL Managed Instance Machine Learning Services: Weitere Informationen finden Sie in der Übersicht über Azure SQL Managed Instance Machine Learning Services.
SQL Server Management Studio (SSMS): SSMS dient zum Wiederherstellen der Beispieldatenbank in Azure SQL Managed Instance. Weitere Informationen zum Herunterladen finden Sie unter SQL Server Management Studio.
Python-IDE: In diesem Tutorial wird ein Python-Notebook in Azure Data Studio verwendet. Weitere Informationen finden Sie unter Verwenden von Notebooks in Azure Data Studio.
SQL-Abfragetool: In diesem Tutorial wird davon ausgegangen, dass Sie Azure Data Studio verwenden.
Weitere Python-Pakete: In den Beispielen in dieser Tutorialreihe werden die folgenden Python-Pakete verwendet, die möglicherweise nicht standardmäßig installiert sind:
- pandas
- pyodbc
- scikit-learn
Installieren Sie diese Pakete wie folgt:
- Klicken Sie in Ihrem Azure Data Studio-Notebook auf die Option Pakete verwalten.
- Klicken Sie dann im Bereich Manage Packages (Pakete verwalten) auf die Registerkarte Add new (Neue hinzufügen).
- Geben Sie für jedes der folgenden Pakete den jeweiligen Paketnamen ein, wählen Sie Suchen und dann Installieren.
Alternativ können Sie eine Eingabeaufforderung öffnen, zum Installationspfad für die Python-Version wechseln, die Sie in Azure Data Studio verwenden, (z. B.
cd %LocalAppData%\Programs\Python\Python37-32
) und dann für jedes Paketpip install
ausführen.
Wiederherstellen der Beispieldatenbank
Die in diesem Tutorial verwendete Beispieldatenbank wurde in einer .bak
-Datenbanksicherungsdatei gespeichert, die Sie herunterladen und verwenden können.
Hinweis
Wenn Sie Machine Learning Services in SQL Server 2019 Big Data-Clustern verwenden, finden Sie Informationen zum Wiederherstellen unter Wiederherstellen einer Datenbank in der Masterinstanz eines Big Data-Clusters.
Laden Sie die Datei TutorialDB.bak herunter.
Befolgen Sie die Anweisungen unter Wiederherstellen einer Datenbank aus einer Sicherungsdatei in Azure Data Studio, und verwenden Sie hierzu die folgenden Details:
- Importieren Sie aus der heruntergeladenen Datei
TutorialDB.bak
. - Benennen Sie die Zieldatenbank
TutorialDB
.
- Importieren Sie aus der heruntergeladenen Datei
Sie können überprüfen, ob die wiederhergestellte Datenbank bereits vorhanden ist, indem Sie die
dbo.rental_data
Tabelle abfragen:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Laden Sie die Datei TutorialDB.bak herunter.
Befolgen Sie die Anweisungen unter Wiederherstellen einer Datenbank in Azure SQL Managed Instance in SQL Server Management Studio. Verwenden Sie hierzu die folgenden Details:
- Importieren Sie aus der heruntergeladenen Datei
TutorialDB.bak
. - Benennen Sie die Zieldatenbank
TutorialDB
.
- Importieren Sie aus der heruntergeladenen Datei
Sie können überprüfen, ob die wiederhergestellte Datenbank bereits vorhanden ist, indem Sie die
dbo.rental_data
Tabelle abfragen:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Bereinigen von Ressourcen
Wenn Sie nicht mit diesem Tutorial fortfahren möchten, löschen Sie die TutorialDB
Datenbank.
Nächster Schritt
Im ersten Teil dieser Tutorialreihe haben Sie die folgenden Schritte ausgeführt:
- Installieren der Voraussetzungen
- Importieren einer Beispieldatenbank
Fahren Sie mit Teil 2 dieser Tutorialreihe fort, um die Daten aus der Datenbank „TutorialDB“ vorzubereiten: