Teilen über


Tutorial: Entwickeln eines Vorhersagemodells in R mit SQL Machine Learning

Gilt für: SQL Server 2016 (13.x) und höher Azure SQL Managed Instance

In dieser vierteiligen Tutorialreihe verwenden Sie R und ein Machine Learning-Modell in SQL Server-Machine Learning Services oder in Big Data-Clustern zur Vorhersage der Verleihzahlen für einen Skiverleih.

In dieser vierteiligen Tutorialreihe verwenden Sie R und ein Machine Learning-Modell in SQL Server-Machine Learning Services zur Vorhersage von Verleihzahlen für einen Skiverleih.

In dieser vierteiligen Tutorialreihe verwenden Sie R und ein Machine Learning-Modell in SQL Server R Services zur Vorhersage von Verleihzahlen für einen Skiverleih.

In dieser vierteiligen Tutorialreihe verwenden Sie R und ein Machine Learning-Modell in Machine Learning Services in Azure SQL Managed Instance zur Vorhersage von Verleihzahlen für einen Skiverleih.

Angenommen, Sie möchten für Ihren eigenen Skiverleih die Verleihzahlen für einen bestimmten Zeitpunkt in der Zukunft vorhersagen. Mit dieser Information können Sie den Bestand, die Mitarbeiter und die Räumlichkeiten besser vorausplanen.

Im ersten Teil der Reihe bereiten Sie die Voraussetzungen vor. Im zweiten und dritten Teil entwickeln Sie R-Skripts in einem Notebook zur Vorbereitung Ihrer Daten und zum Trainieren eines Machine Learning-Modells. In Teil 3 führen Sie diese R-Skripts dann mithilfe von gespeicherten T-SQL-Prozeduren in einer Datenbank aus.

In diesem Artikel lernen Sie Folgendes:

  • Wiederherstellen einer Beispieldatenbank

In Teil 2 lernen Sie, wie Sie die Daten aus einer Datenbank in einen Python-Datenrahmen laden und in R vorbereiten.

In Teil 3 erfahren Sie, wie Sie ein Machine Learning-Modell in R trainieren.

In Teil 4 haben Sie gelernt, wie Sie das Modell in einer Datenbank speichern und gespeicherte Prozeduren aus den R-Skripts erstellen, die Sie in Teil 2 und 3 entwickelt haben. Die gespeicherten Prozeduren werden auf dem Server ausgeführt, um Vorhersagen basierend auf neuen Daten treffen zu können.

Voraussetzungen

  • R-IDE: In diesem Tutorial wird RStudio Desktop verwendet.

  • RODBC: Dieser Treiber wird in den R-Skripts verwendet, die Sie in diesem Tutorial entwickeln. Installieren Sie ihn mithilfe des R-Befehls install.packages("RODBC"), sofern er noch nicht installiert ist. Weitere Informationen zu RODBC finden Sie unter CRAN – RODBC-Paket.

  • SQL-Abfragetool: In diesem Tutorial wird davon ausgegangen, dass Sie Azure Data Studio verwenden. Weitere Informationen finden Sie unter Verwenden von Notebooks in Azure Data Studio.

Wiederherstellen der Beispieldatenbank

Die in diesem Tutorial verwendete Beispieldatenbank wurde in einer .bak-Datenbanksicherungsdatei gespeichert, die Sie herunterladen und verwenden können.

Hinweis

Wenn Sie Machine Learning Services in Big Data-Clustern verwenden, finden Sie Informationen zum Wiederherstellen unter Wiederherstellen einer Datenbank in der Masterinstanz eines Big Data-Clusters für SQL Server.

  1. Laden Sie die Datei TutorialDB.bak herunter.

  2. Befolgen Sie die Anweisungen unter Wiederherstellen einer Datenbank aus einer Sicherungsdatei in Azure Data Studio, und verwenden Sie hierzu die folgenden Details:

    • Importieren Sie aus der heruntergeladenen Datei TutorialDB.bak.
    • Benennen Sie die Zieldatenbank TutorialDB.
  3. Sie können überprüfen, ob die wiederhergestellte Datenbank bereits vorhanden ist, indem Sie die dbo.rental_data Tabelle abfragen:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Laden Sie die Datei TutorialDB.bak herunter.

  2. Befolgen Sie die Anweisungen unter Wiederherstellen einer Datenbank in Azure SQL Managed Instance in SQL Server Management Studio. Verwenden Sie hierzu die folgenden Details:

    • Importieren Sie aus der heruntergeladenen Datei TutorialDB.bak.
    • Benennen Sie die Zieldatenbank TutorialDB.
  3. Sie können überprüfen, ob die wiederhergestellte Datenbank bereits vorhanden ist, indem Sie die dbo.rental_data Tabelle abfragen:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Bereinigen von Ressourcen

Wenn Sie nicht mit diesem Tutorial fortfahren möchten, löschen Sie die Datenbank „TutorialDB“.

Nächster Schritt

Im ersten Teil dieser Tutorialreihe haben Sie die folgenden Schritte ausgeführt:

  • Installieren der Voraussetzungen
  • Wiederherstellen einer Beispieldatenbank

Fahren Sie mit dem zweiten Teil dieser Tutorialreihe fort, um die Daten für das Machine Learning-Modell vorzubereiten: