Tutoriel : Développement d’un modèle prédictif en R avec le Machine Learning SQL

S’applique à : SQL Server 2016 (13.x) et versions ultérieures Azure SQL Managed Instance

Dans cette série de tutoriels en quatre parties, vous allez utiliser R et un modèle Machine Learning dans SQL Server Machine Learning Services ou sur des clusters Big Data pour prédire le nombre de locations de skis.

Dans cette série de tutoriels en quatre parties, vous allez utiliser R et un modèle Machine Learning dans SQL Server Machine Learning Services pour prédire le nombre de locations de skis.

Dans cette série de tutoriels en quatre parties, vous allez utiliser R et un modèle Machine Learning dans SQL Server R Services pour prédire le nombre de locations de skis.

Dans cette série de quatre tutoriels, vous allez utiliser R et un modèle Machine Learning dans Azure SQL Managed Instance Machine Learning Services pour prédire le nombre de locations de ski.

Imaginez que vous êtes une entreprise de location de ski et que vous souhaitez prédire le nombre de locations à une date ultérieure. Ces informations vous aideront à préparer votre inventaire, votre personnel et vos installations.

Dans la première partie de ce tutoriel, vous allez configurer les composants requis. Dans les parties 2 et 3, vous allez développer des scripts R dans un notebook pour préparer vos données et effectuer l’apprentissage d’un modèle Machine Learning. Ensuite, dans la troisième partie, vous exécuterez ces scripts R à l’intérieur d’une base de données à l’aide de procédures stockées T-SQL.

Dans cet article, vous allez apprendre à :

  • Restaurer un exemple de base de données

Dans la deuxième partie, vous allez apprendre à charger les données à partir d’une base de données dans une trame de données Python et à préparer les données dans R.

Dans la troisième partie, vous apprendrez à effectuer l’apprentissage d’un modèle Machine Learning dans R.

Dans la quatrième partie, vous apprendrez à stocker le modèle dans une base de données, puis à créer des procédures stockées à partir des scripts R que vous avez développés dans les parties 2 et 3. Les procédures stockées sont exécutées sur le serveur pour effectuer des prédictions en fonction de nouvelles données.

Prérequis

Restaurer les exemples de base de données

L’exemple de base de données utilisé dans ce tutoriel a été enregistré dans un fichier de sauvegarde de base de données .bak que vous pouvez télécharger et utiliser.

Notes

Si vous utilisez Machine Learning Services sur des clusters Big Data, consultez Restaurer une base de données dans l’instance principale du cluster Big Data SQL Server.

  1. Téléchargez le fichier TutorialDB.bak.

  2. Suivez les instructions dans Restaurer une base de données à partir d’un fichier de sauvegarde dans Azure Data Studio, en utilisant les informations suivantes :

    • Importer à partir du fichier TutorialDB.bak que vous avez téléchargé
    • Nommez la base de données cible « TutorialDB ».
  3. Vous pouvez vérifier que la base de données restaurée existe en interrogeant la table dbo.rental_data :

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Téléchargez le fichier TutorialDB.bak.

  2. Suivez les instructions de Restauration d’une base de données sur une instance gérée dans SQL Server Management Studio, en utilisant les informations suivantes :

    • Importer à partir du fichier TutorialDB.bak que vous avez téléchargé
    • Nommez la base de données cible « TutorialDB ».
  3. Vous pouvez vérifier que la base de données restaurée existe en interrogeant la table dbo.rental_data :

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Nettoyer les ressources

Si vous ne poursuivez pas ce tutoriel, supprimez la base de données TutorialDB.

Étapes suivantes

Dans la première partie de cette série de tutoriels, vous avez effectué les étapes suivantes :

  • Installer les prérequis
  • Restaurer un exemple de base de données

Pour préparer les données pour le modèle Machine Learning, suivez la deuxième partie de cette série de tutoriels :