Partager via


Tutoriel : Assistant d'évaluation de modèle d'apprentissage automatique pour les pools SQL dédiés

Découvrez comment enrichir facilement vos données dans des pools SQL dédiés avec des modèles Machine Learning prédictifs. Les modèles créés par vos scientifiques des données sont désormais facilement accessibles aux professionnels des données pour l’analytique prédictive. Un professionnel des données dans Azure Synapse Analytics peut simplement sélectionner un modèle à partir du registre de modèles Azure Machine Learning pour le déploiement dans des pools SQL Azure Synapse et lancer des prédictions pour enrichir les données.

Dans ce tutoriel, vous apprendrez comment le faire :

  • Entraîner un modèle Machine Learning prédictif et enregistrer le modèle dans le registre de modèles Azure Machine Learning
  • Utiliser l’Assistant de scoring SQL pour lancer des prédictions dans un pool SQL dédié

Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer.

Prerequisites

Connectez-vous au portail Azure.

Connectez-vous au portail Azure.

Entraîner un modèle dans Azure Machine Learning

Avant de commencer, vérifiez que votre version de sklearn est 0.20.3.

Avant d’exécuter toutes les cellules du notebook, vérifiez que l’instance de calcul est en cours d’exécution.

Capture d’écran montrant la vérification du calcul Azure Machine Learning.

  1. Accédez à votre espace de travail Azure Machine Learning.

  2. Téléchargez Predict NYC Taxi Tips.ipynb.

  3. Ouvrez l’espace de travail Azure Machine Learning dans Azure Machine Learning Studio.

  4. Accédez à Notebooks>Charger des fichiers. Sélectionnez ensuite le fichier Predict NYC Taxi Tips.ipynb que vous avez téléchargé et chargez-le. Capture d’écran du bouton pour le chargement d’un fichier.

  5. Une fois le bloc-notes chargé et ouvert, sélectionnez Exécuter toutes les cellules.

    Une des cellules peut échouer et vous demander de vous authentifier auprès d’Azure. Surveillez cette opération dans les sorties de cellule et authentifiez-vous dans votre navigateur en suivant le lien et en entrant le code. Réexécutez ensuite le notebook.

  6. Le notebook entraîne un modèle ONNX et l’inscrit auprès de MLflow. Accédez à Modèles pour vérifier que le nouveau modèle est inscrit correctement. Capture d’écran montrant le modèle dans le Registre.

  7. L’exécution du notebook exporte également les données de test dans un fichier CSV. Téléchargez le fichier CSV sur votre système local. Plus tard, vous allez importer le fichier CSV dans un pool SQL dédié et utiliser les données pour tester le modèle.

    Le fichier CSV est créé dans le même dossier que votre fichier de notebook. Sélectionnez Actualiser dans l’Explorateur de fichiers si vous ne le voyez pas immédiatement.

    Capture d’écran montrant le fichier C S V.

Lancer les prédictions avec l’assistant d’évaluation SQL

  1. Ouvrez l’espace de travail Azure Synapse avec Synapse Studio.

  2. Accédez aux données>liées>comptes de stockage. Chargez test_data.csv sur le compte de stockage par défaut.

    Capture d’écran montrant les sélections pour le chargement de données.

  3. Accédez à Développer>Scripts SQL. Créez un nouveau script SQL pour charger test_data.csv dans votre pool SQL dédié.

    Note

    Mettez à jour l’URL du fichier dans ce script avant de l’exécuter.

    IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U')
    CREATE TABLE dbo.nyc_taxi
    (
        tipped int,
        fareAmount float,
        paymentType int,
        passengerCount int,
        tripDistance float,
        tripTimeSecs bigint,
        pickupTimeBin nvarchar(30)
    )
    WITH
    (
        DISTRIBUTION = ROUND_ROBIN,
        CLUSTERED COLUMNSTORE INDEX
    )
    GO
    
    COPY INTO dbo.nyc_taxi
    (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7)
    FROM '<URL to linked storage account>/test_data.csv'
    WITH
    (
        FILE_TYPE = 'CSV',
        ROWTERMINATOR='0x0A',
        FIELDQUOTE = '"',
        FIELDTERMINATOR = ',',
        FIRSTROW = 2
    )
    GO
    
    SELECT TOP 100 * FROM nyc_taxi
    GO
    

    Charger des données sur un pool SQL dédié

  4. Accédez à Données>Espace de travail. Ouvrez l’Assistant de scoring SQL en cliquant avec le bouton droit sur la table du pool SQL dédié. Sélectionnez Machine Learning>Predict avec un modèle.

    Note

    L’option Machine Learning n’apparaît pas, sauf si vous avez un service lié créé pour Azure Machine Learning. (Consultez les conditions préalables au début de ce didacticiel.)

    Capture d’écran montrant l’option Machine Learning.

  5. Sélectionnez un espace de travail Azure Machine Learning lié dans la zone de liste déroulante. Cette étape charge une liste de modèles Machine Learning à partir du registre de modèles de l’espace de travail Azure Machine Learning choisi. Actuellement, seuls les modèles ONNX sont pris en charge. Cette étape affiche uniquement les modèles ONNX.

  6. Sélectionnez le modèle que vous venez d’entraîner, puis sélectionnez Continuer.

    Capture d’écran montrant la sélection du modèle Azure Machine Learning.

  7. Mappez les colonnes de table aux entrées du modèle et spécifiez les sorties du modèle. Si le modèle est enregistré au format MLflow et que la signature du modèle est remplie, le mappage est effectué automatiquement pour vous à l’aide d’une logique basée sur la similarité des noms. L’interface prend également en charge le mappage manuel.

    Sélectionnez Continuer.

    Capture d’écran montrant le mappage table à modèle.

  8. Le code T-SQL généré est encapsulé dans une procédure stockée. C’est pourquoi vous devez fournir un nom de procédure stockée. Le fichier binaire du modèle, y compris les métadonnées (version, description et autres informations), sera copié physiquement à partir d’Azure Machine Learning vers une table de pool SQL dédiée. Vous devez donc spécifier la table dans laquelle enregistrer le modèle.

    Vous pouvez choisir une table existante ou créer une nouvelle table. Lorsque vous avez terminé, sélectionnez Déployer le modèle + ouvrir le script pour déployer le modèle et générer un script de prédiction T-SQL.

    Capture d’écran montrant les sélections pour la création d’une procédure stockée.

  9. Une fois le script généré, sélectionnez Exécuter pour exécuter le scoring et obtenir des prédictions.

    Capture d’écran montrant le scoring et les prédictions.

Étapes suivantes