Tutoriel : Développement d’un modèle prédictif en R avec le Machine Learning SQL
S’applique à : SQL Server 2016 (13.x) et versions ultérieures Azure SQL Managed Instance
Dans cette série de tutoriels en quatre parties, vous allez utiliser R et un modèle Machine Learning dans SQL Server Machine Learning Services ou sur des clusters Big Data pour prédire le nombre de locations de skis.
Dans cette série de tutoriels en quatre parties, vous allez utiliser R et un modèle Machine Learning dans SQL Server Machine Learning Services pour prédire le nombre de locations de skis.
Dans cette série de tutoriels en quatre parties, vous allez utiliser R et un modèle Machine Learning dans SQL Server R Services pour prédire le nombre de locations de skis.
Dans cette série de quatre tutoriels, vous allez utiliser R et un modèle Machine Learning dans Azure SQL Managed Instance Machine Learning Services pour prédire le nombre de locations de ski.
Imaginez que vous êtes une entreprise de location de ski et que vous souhaitez prédire le nombre de locations à une date ultérieure. Ces informations vous aideront à préparer votre inventaire, votre personnel et vos installations.
Dans la première partie de ce tutoriel, vous allez configurer les composants requis. Dans les parties 2 et 3, vous allez développer des scripts R dans un notebook pour préparer vos données et effectuer l’apprentissage d’un modèle Machine Learning. Ensuite, dans la troisième partie, vous exécuterez ces scripts R à l’intérieur d’une base de données à l’aide de procédures stockées T-SQL.
Dans cet article, vous allez apprendre à :
- Restaurer un exemple de base de données
Dans la deuxième partie, vous allez apprendre à charger les données à partir d’une base de données dans une trame de données Python et à préparer les données dans R.
Dans la troisième partie, vous apprendrez à effectuer l’apprentissage d’un modèle Machine Learning dans R.
Dans la quatrième partie, vous apprendrez à stocker le modèle dans une base de données, puis à créer des procédures stockées à partir des scripts R que vous avez développés dans les parties 2 et 3. Les procédures stockées sont exécutées sur le serveur pour effectuer des prédictions en fonction de nouvelles données.
Prérequis
- SQL Server Machine Learning Services - Pour installer Machine Learning Services, consultez le Guide d’installation Windows ou le Guide d’installation Linux. Vous pouvez également activer Machine Learning Services sur des clusters Big Data SQL Server.
- SQL Server Machine Learning Services : pour installer Machine Learning Services, consultez le Guide d’installation Windows.
- SQL Server 2016 R Services : pour installer R Services, consultez le Guide d’installation Windows.
Azure SQL Managed Instance Machine Learning Services. Pour plus d’informations, consultez Présentation de Machine Learning Services dans Azure SQL Managed Instance.
SQL Server Management Studio (SSMS) : utilisez SSMS pour restaurer l’exemple de base de données dans Azure SQL Managed Instance. Pour télécharger, consultez SQL Server Management Studio (SSMS).
R IDE : ce tutoriel utilise RStudio Desktop.
RODBC : ce pilote est utilisé dans les scripts R que vous allez développer à l’aide de ce tutoriel. S’il n’est pas déjà installé, installez-le à l’aide de la commande R
install.packages("RODBC")
. Pour plus d’informations sur RODBC, consultez CRAN - Package RODBC.Outil de requête SQL : ce didacticiel part du principe que vous utilisez Azure Data Studio. Pour en savoir plus, consultez Comment utiliser les notebooks dans Azure Data Studio.
Restaurer les exemples de base de données
L’exemple de base de données utilisé dans ce tutoriel a été enregistré dans un fichier de sauvegarde de base de données .bak
que vous pouvez télécharger et utiliser.
Remarque
Si vous utilisez Machine Learning Services sur des clusters Big Data, consultez Restaurer une base de données dans l’instance principale du cluster Big Data SQL Server.
Téléchargez le fichier TutorialDB.bak.
Suivez les instructions dans Restaurer une base de données à partir d’un fichier de sauvegarde dans Azure Data Studio, en utilisant les informations suivantes :
- Importez à partir du fichier
TutorialDB.bak
que vous avez téléchargé. - Nommez la base de données cible
TutorialDB
.
- Importez à partir du fichier
Vous pouvez vérifier que la base de données restaurée existe en interrogeant la table
dbo.rental_data
:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Téléchargez le fichier TutorialDB.bak.
Suivez les instructions de Restauration d’une base de données sur Azure SQL Managed Instance dans SQL Server Management Studio, en utilisant les informations suivantes :
- Importez à partir du fichier
TutorialDB.bak
que vous avez téléchargé. - Nommez la base de données cible
TutorialDB
.
- Importez à partir du fichier
Vous pouvez vérifier que la base de données restaurée existe en interrogeant la table
dbo.rental_data
:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Nettoyer les ressources
Si vous ne poursuivez pas ce tutoriel, supprimez la base de données TutorialDB.
Étape suivante
Dans la première partie de cette série de tutoriels, vous avez effectué les étapes suivantes :
- Installer les prérequis
- Restaurer un exemple de base de données
Pour préparer les données pour le modèle Machine Learning, suivez la deuxième partie de cette série de tutoriels :