Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Découvrez comment enrichir facilement vos données dans des pools SQL dédiés avec des modèles Machine Learning prédictifs. Les modèles créés par vos scientifiques des données sont désormais facilement accessibles aux professionnels des données pour l’analytique prédictive. Un professionnel des données dans Azure Synapse Analytics peut simplement sélectionner un modèle à partir du registre de modèles Azure Machine Learning pour le déploiement dans des pools SQL Azure Synapse et lancer des prédictions pour enrichir les données.
Dans ce tutoriel, vous apprendrez comment le faire :
- Entraîner un modèle Machine Learning prédictif et enregistrer le modèle dans le registre de modèles Azure Machine Learning
- Utiliser l’Assistant de scoring SQL pour lancer des prédictions dans un pool SQL dédié
Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer.
Prerequisites
- Espace de travail Azure Synapse Analytics avec un compte de stockage Azure Data Lake Storage Gen2 configuré comme stockage par défaut. Vous devez être le contributeur aux données Blob du stockage du système de fichiers Data Lake Storage Gen2 que vous utilisez.
- Pool SQL dédié dans votre espace de travail Azure Synapse Analytics. Pour plus d’informations, consultez Créer un pool SQL dédié.
- Service lié Azure Machine Learning dans votre espace de travail Azure Synapse Analytics. Pour plus d’informations, consultez Créer un service lié Azure Machine Learning dans Azure Synapse.
Connectez-vous au portail Azure.
Connectez-vous au portail Azure.
Entraîner un modèle dans Azure Machine Learning
Avant de commencer, vérifiez que votre version de sklearn est 0.20.3.
Avant d’exécuter toutes les cellules du notebook, vérifiez que l’instance de calcul est en cours d’exécution.
Accédez à votre espace de travail Azure Machine Learning.
Téléchargez Predict NYC Taxi Tips.ipynb.
Ouvrez l’espace de travail Azure Machine Learning dans Azure Machine Learning Studio.
Accédez à Notebooks>Charger des fichiers. Sélectionnez ensuite le fichier Predict NYC Taxi Tips.ipynb que vous avez téléchargé et chargez-le.
Une fois le bloc-notes chargé et ouvert, sélectionnez Exécuter toutes les cellules.
Une des cellules peut échouer et vous demander de vous authentifier auprès d’Azure. Surveillez cette opération dans les sorties de cellule et authentifiez-vous dans votre navigateur en suivant le lien et en entrant le code. Réexécutez ensuite le notebook.
Le notebook entraîne un modèle ONNX et l’inscrit auprès de MLflow. Accédez à Modèles pour vérifier que le nouveau modèle est inscrit correctement.
L’exécution du notebook exporte également les données de test dans un fichier CSV. Téléchargez le fichier CSV sur votre système local. Plus tard, vous allez importer le fichier CSV dans un pool SQL dédié et utiliser les données pour tester le modèle.
Le fichier CSV est créé dans le même dossier que votre fichier de notebook. Sélectionnez Actualiser dans l’Explorateur de fichiers si vous ne le voyez pas immédiatement.
Lancer les prédictions avec l’assistant d’évaluation SQL
Ouvrez l’espace de travail Azure Synapse avec Synapse Studio.
Accédez aux données>liées>comptes de stockage. Chargez
test_data.csvsur le compte de stockage par défaut.
Accédez à Développer>Scripts SQL. Créez un nouveau script SQL pour charger
test_data.csvdans votre pool SQL dédié.Note
Mettez à jour l’URL du fichier dans ce script avant de l’exécuter.
IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U') CREATE TABLE dbo.nyc_taxi ( tipped int, fareAmount float, paymentType int, passengerCount int, tripDistance float, tripTimeSecs bigint, pickupTimeBin nvarchar(30) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX ) GO COPY INTO dbo.nyc_taxi (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7) FROM '<URL to linked storage account>/test_data.csv' WITH ( FILE_TYPE = 'CSV', ROWTERMINATOR='0x0A', FIELDQUOTE = '"', FIELDTERMINATOR = ',', FIRSTROW = 2 ) GO SELECT TOP 100 * FROM nyc_taxi GO
Accédez à Données>Espace de travail. Ouvrez l’Assistant de scoring SQL en cliquant avec le bouton droit sur la table du pool SQL dédié. Sélectionnez Machine Learning>Predict avec un modèle.
Note
L’option Machine Learning n’apparaît pas, sauf si vous avez un service lié créé pour Azure Machine Learning. (Consultez les conditions préalables au début de ce didacticiel.)
Sélectionnez un espace de travail Azure Machine Learning lié dans la zone de liste déroulante. Cette étape charge une liste de modèles Machine Learning à partir du registre de modèles de l’espace de travail Azure Machine Learning choisi. Actuellement, seuls les modèles ONNX sont pris en charge. Cette étape affiche uniquement les modèles ONNX.
Sélectionnez le modèle que vous venez d’entraîner, puis sélectionnez Continuer.
Mappez les colonnes de table aux entrées du modèle et spécifiez les sorties du modèle. Si le modèle est enregistré au format MLflow et que la signature du modèle est remplie, le mappage est effectué automatiquement pour vous à l’aide d’une logique basée sur la similarité des noms. L’interface prend également en charge le mappage manuel.
Sélectionnez Continuer.
Le code T-SQL généré est encapsulé dans une procédure stockée. C’est pourquoi vous devez fournir un nom de procédure stockée. Le fichier binaire du modèle, y compris les métadonnées (version, description et autres informations), sera copié physiquement à partir d’Azure Machine Learning vers une table de pool SQL dédiée. Vous devez donc spécifier la table dans laquelle enregistrer le modèle.
Vous pouvez choisir une table existante ou créer une nouvelle table. Lorsque vous avez terminé, sélectionnez Déployer le modèle + ouvrir le script pour déployer le modèle et générer un script de prédiction T-SQL.
Une fois le script généré, sélectionnez Exécuter pour exécuter le scoring et obtenir des prédictions.