Démarrage rapide : Bien démarrer avec Azure Machine Learning

S’APPLIQUE À : Kit de développement logiciel (SDK) Python azure-ai-mlv2 (préversion)

Ce tutoriel présente certaines des fonctionnalités les plus utilisées du service Azure Machine Learning. Vous créez, inscrivez et déployez un modèle. Ce tutoriel vous aide à vous familiariser avec les concepts fondamentaux d’Azure Machine Learning et leur utilisation la plus courante.

Dans ce guide de démarrage rapide, vous entraînez, inscrivez et déployez un modèle Machine Learning à l’aide d’Azure Machine Learning, tous à partir d’un notebook Python. À la fin, vous disposez d’un point de terminaison fonctionnel que vous pouvez appeler pour effectuer des prédictions.

Vous apprenez à :

Exécuter un travail de formation sur un calcul cloud évolutif
Inscrire votre modèle entraîné
Déployer le modèle en tant que point de terminaison en ligne
Tester le point de terminaison avec des exemples de données

Vous allez créer un script d’apprentissage pour gérer la préparation des données, l’apprentissage et l’inscription d’un modèle. Après avoir entraîné le modèle, vous le déployez en tant que point de terminaison, puis appelez le point de terminaison pour l’inférence.

Voici les étapes à suivre :

Configurer un descripteur vers votre espace de travail Azure Machine Learning
Créer votre script d’entraînement
Créer une ressource de calcul évolutive, un cluster de calcul
Créer et exécuter un travail de commande qui exécute le script d’entraînement sur le cluster de calcul, configuré avec l’environnement de travail approprié
Afficher la sortie de votre script d’entraînement
Déployer le modèle nouvellement entraîné en tant que point de terminaison.
Appeler le point de terminaison Azure Machine Learning pour l’inférence

Prérequis

Pour utiliser Azure Machine Learning, vous avez besoin d’un espace de travail. Si vous n’en avez pas, suivez la procédure Créer les ressources nécessaires pour commencer pour créer un espace de travail et en savoir plus sur son utilisation.

Important

Si votre espace de travail Azure Machine Learning est configuré avec un réseau virtuel managé, vous devrez peut-être ajouter des règles de trafic sortant pour autoriser l’accès aux dépôts publics de packages Python. Pour plus d’informations, voir Scénario : Accéder aux packages d’apprentissage automatique publics.
Connectez-vous au studio et sélectionnez votre espace de travail s’il n’est pas encore ouvert.
Ouvrez ou créez un notebook dans votre espace de travail :
- Si vous souhaitez copier et coller du code dans les cellules, créez un notebook.
- Ou ouvrez tutorials/get-started-notebooks/quickstart.ipynb à partir de la section Exemples de Studio. Sélectionnez ensuite Cloner pour ajouter le notebook à vos fichiers. Pour trouver des exemples de notebooks, consultez Apprendre à partir d’exemples de notebooks.

Définir votre noyau et ouvrir dans Visual Studio Code (VS Code)

Dans la barre supérieure au-dessus de votre notebook ouvert, créez une instance de calcul si vous n’en avez pas déjà une.
Si l’instance de calcul est arrêtée, sélectionnez Démarrer le calcul et attendez qu’elle s’exécute.
Attendez que l’instance de calcul soit en cours d’exécution. Ensuite, assurez-vous que le noyau, situé en haut à droite, est Python 3.10 - SDK v2. Si ce n’est pas le cas, sélectionnez ce noyau à l’aide de la liste déroulante.

Si vous ne voyez pas ce noyau, vérifiez que votre instance de calcul est en cours d’exécution. Si tel est le cas, cliquez sur le bouton Actualiser en haut du notebook à droite.
Si une bannière vous indique que vous devez être authentifié, sélectionnez Authentifier.
Vous pouvez exécuter le notebook ici ou l’ouvrir dans VS Code pour un environnement de développement intégré (IDE) complet avec la puissance des ressources Azure Machine Learning. Cliquez sur Ouvrir dans VS Code, puis sélectionnez l’option Web ou Bureau. Lors d’un tel lancement, VS Code est attaché à votre instance de calcul, au noyau et au système de fichiers de l’espace de travail.

Important

Le reste de ce tutoriel contient des cellules du notebook du tutoriel. Copiez-le, et collez-le dans votre nouveau notebook, ou accédez maintenant au notebook si vous l’avez cloné.

Créer un descripteur vers l’espace de travail

Avant de vous plonger dans le code, vous avez besoin d’un moyen de référencer votre espace de travail. L’espace de travail est la ressource de niveau supérieur pour Azure Machine Learning. Il fournit un emplacement centralisé dans lequel exploiter tous les artefacts que vous créez lorsque vous utilisez Azure Machine Learning.

Créez ml_client en tant que handle pour votre espace de travail : ce client gère toutes vos ressources et travaux.

Dans la cellule suivante, entrez votre ID d’abonnement, le nom du groupe de ressources et le nom de l’espace de travail. Pour rechercher ces valeurs :

Dans la barre d’outils supérieure droite d’Azure Machine Learning Studio, sélectionnez le nom de votre espace de travail.
Copiez la valeur de l’espace de travail, du groupe de ressources et de l’ID d’abonnement dans le code.
Copiez une valeur, fermez la zone et collez-la. Revenez ensuite pour la valeur suivante.

Capture d’écran : recherchez les informations d’identification de votre code en haut à droite de la barre d’outils.

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential, InteractiveBrowserCredential

# authenticate
try:
    credential = DefaultAzureCredential()
    credential.get_token("https://management.azure.com/.default")
except Exception:
    credential = InteractiveBrowserCredential()

SUBSCRIPTION = "<SUBSCRIPTION_ID>"
RESOURCE_GROUP = "<RESOURCE_GROUP>"
WS_NAME = "<AML_WORKSPACE_NAME>"
# Get a handle to the workspace
ml_client = MLClient(
    credential=credential,
    subscription_id=SUBSCRIPTION,
    resource_group_name=RESOURCE_GROUP,
    workspace_name=WS_NAME,
)

Remarque

La création de MLClient n’établit pas de connexion à l’espace de travail. L’initialisation du client est différée. Elle attend jusqu'à la première fois qu'elle doit passer un appel. Cette action se produit dans la cellule de code suivante.

# Verify that the handle works correctly.
# If you ge an error here, modify your SUBSCRIPTION, RESOURCE_GROUP, and WS_NAME in the previous cell.
ws = ml_client.workspaces.get(WS_NAME)
print(ws.location, ":", ws.resource_group)

Créer un script d’entraînement

Créez le script d’entraînement, qui est le fichier main.py Python.

Tout d’abord, créez un dossier source pour le script :

import os

train_src_dir = "./src"
os.makedirs(train_src_dir, exist_ok=True)

Ce script prétraite les données et les fractionne en jeux de données de test et d’apprentissage. Il entraîne un modèle basé sur une arborescence à l’aide de ces données et retourne le modèle de sortie.

Pendant l’exécution du pipeline, utilisez MLFlow pour consigner les paramètres et les métriques.

La cellule suivante utilise la magie IPython pour écrire le script d’entraînement dans le répertoire que vous venez de créer.

%%writefile {train_src_dir}/main.py
import os
import argparse
import pandas as pd
import mlflow
import mlflow.sklearn
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split

def main():
    """Main function of the script."""

    # input and output arguments
    parser = argparse.ArgumentParser()
    parser.add_argument("--data", type=str, help="path to input data")
    parser.add_argument("--test_train_ratio", type=float, required=False, default=0.25)
    parser.add_argument("--n_estimators", required=False, default=100, type=int)
    parser.add_argument("--learning_rate", required=False, default=0.1, type=float)
    parser.add_argument("--registered_model_name", type=str, help="model name")
    args = parser.parse_args()
   
    # Start Logging
    mlflow.start_run()

    # enable autologging
    mlflow.sklearn.autolog()

    ###################
    #<prepare the data>
    ###################
    print(" ".join(f"{k}={v}" for k, v in vars(args).items()))

    print("input data:", args.data)
    
    credit_df = pd.read_csv(args.data, header=1, index_col=0)

    mlflow.log_metric("num_samples", credit_df.shape[0])
    mlflow.log_metric("num_features", credit_df.shape[1] - 1)

    train_df, test_df = train_test_split(
        credit_df,
        test_size=args.test_train_ratio,
    )
    ####################
    #</prepare the data>
    ####################

    ##################
    #<train the model>
    ##################
    # Extracting the label column
    y_train = train_df.pop("default payment next month")

    # convert the dataframe values to array
    X_train = train_df.values

    # Extracting the label column
    y_test = test_df.pop("default payment next month")

    # convert the dataframe values to array
    X_test = test_df.values

    print(f"Training with data of shape {X_train.shape}")

    clf = GradientBoostingClassifier(
        n_estimators=args.n_estimators, learning_rate=args.learning_rate
    )
    clf.fit(X_train, y_train)

    y_pred = clf.predict(X_test)

    print(classification_report(y_test, y_pred))
    ###################
    #</train the model>
    ###################

    ##########################
    #<save and register model>
    ##########################
    # Registering the model to the workspace
    print("Registering the model via MLFlow")

    # pin numpy
    conda_env = {
        'name': 'mlflow-env',
        'channels': ['conda-forge'],
        'dependencies': [
            'python=3.10.15',
            'pip<=21.3.1',
            {
                'pip': [
                    'mlflow==2.17.0',
                    'cloudpickle==2.2.1',
                    'pandas==1.5.3',
                    'psutil==5.8.0',
                    'scikit-learn==1.5.2',
                    'numpy==1.26.4',
                ]
            }
        ],
    }

    mlflow.sklearn.log_model(
        sk_model=clf,
        registered_model_name=args.registered_model_name,
        artifact_path=args.registered_model_name,
        conda_env=conda_env,
    )

    # Saving the model to a file
    mlflow.sklearn.save_model(
        sk_model=clf,
        path=os.path.join(args.registered_model_name, "trained_model"),
    )
    ###########################
    #</save and register model>
    ###########################
    
    # Stop Logging
    mlflow.end_run()

if __name__ == "__main__":
    main()

Lorsque le modèle est entraîné, le script enregistre et inscrit le fichier de modèle dans l’espace de travail. Vous pouvez utiliser le modèle inscrit dans les points de terminaison d’inférence.

Vous devrez peut-être sélectionner Actualiser pour afficher le nouveau dossier et le nouveau script dans vos fichiers.

Capture d’écran montrant l’icône Actualiser.

Configurer la commande

Vous disposez maintenant d’un script qui peut effectuer les tâches souhaitées et un cluster de calcul pour exécuter le script. Utilisez une commande à usage général qui peut exécuter des actions de ligne de commande. Cette action de ligne de commande peut appeler directement des commandes système ou exécuter un script.

Créez des variables d’entrée pour spécifier les données d’entrée, le ratio fractionné, le taux d’apprentissage et le nom du modèle inscrit. Le script de commande :

Utilise un environnement qui définit les bibliothèques de logiciels et d’exécution nécessaires pour le script d’entraînement. Azure Machine Learning fournit de nombreux environnements organisés ou prêts à l’utilisation, qui sont utiles pour les scénarios courants d’apprentissage et d’inférence. Vous allez utiliser l’un de ces environnements ici. Dans Tutoriel : Effectuer l’apprentissage d’un modèle dans Azure Machine Learning, vous allez découvrir comment créer un environnement personnalisé.
Configure l’action de ligne de commande elle-même, à savoir python main.py dans ce cas. Les entrées et sorties sont accessibles dans la commande via la ${{ ... }} notation.
Accède aux données à partir d’un fichier sur Internet.
Comme vous n’avez pas spécifié de ressource de calcul, le script s’exécute sur un cluster de calcul serverless créé automatiquement.

from azure.ai.ml import command
from azure.ai.ml import Input

registered_model_name = "credit_defaults_model"

job = command(
    inputs=dict(
        data=Input(
            type="uri_file",
            path="https://azuremlexamples.blob.core.windows.net/datasets/credit_card/default_of_credit_card_clients.csv",
        ),
        test_train_ratio=0.2,
        learning_rate=0.25,
        registered_model_name=registered_model_name,
    ),
    code="./src/",  # location of source code
    command="python main.py --data ${{inputs.data}} --test_train_ratio ${{inputs.test_train_ratio}} --learning_rate ${{inputs.learning_rate}} --registered_model_name ${{inputs.registered_model_name}}",
    environment="azureml://registries/azureml/environments/sklearn-1.5/labels/latest",
    display_name="credit_default_prediction",
)

Envoi du travail

Envoyez le travail à exécuter dans Azure Machine Learning. Cette fois, utilisez create_or_update sur ml_client.

ml_client.create_or_update(job)

Afficher la sortie du travail et attendre l’achèvement du travail

Affichez le travail dans Azure Machine Learning Studio en sélectionnant le lien dans la sortie de la cellule précédente.

La sortie de ce travail ressemble à ceci dans Azure Machine Learning studio. Explorez les onglets pour obtenir différents détails tels que les métriques, les sorties, etc. Une fois terminé, le travail inscrit un modèle dans votre espace de travail suite à l’apprentissage.

Capture d’écran montrant la page de vue d’ensemble du travail.

Important

Attendez que l’état du travail affiche Terminé avant de continuer( généralement 2 à 3 minutes). Si le cluster de calcul est réduit à zéro, prévoyez jusqu'à 10 minutes pour lui permettre de se provisionner.

Pendant que vous attendez, explorez les détails du travail dans le studio :

Onglet Métriques : Afficher les métriques d’entraînement journalisées par MLflow
Onglet Sorties + journaux : vérifiez les journaux d’entraînement
Onglet Modèles : Voir le modèle inscrit (après l’achèvement)

Déployer le modèle en tant que point de terminaison en ligne

Déployez votre modèle Machine Learning en tant que service web dans le cloud Azure à l’aide d’un online endpoint.

Pour déployer un service Machine Learning, utilisez le modèle que vous avez inscrit.

Créer un point de terminaison en ligne

Maintenant que vous avez inscrit un modèle, créez votre point de terminaison en ligne. Le nom du point de terminaison doit être unique dans toute la région Azure. Pour ce tutoriel, créez un nom unique à l’aide de UUID.

import uuid

# Creating a unique name for the endpoint
online_endpoint_name = "credit-endpoint-" + str(uuid.uuid4())[:8]

Créez le point de terminaison.

# Expect the endpoint creation to take a few minutes
from azure.ai.ml.entities import (
    ManagedOnlineEndpoint,
    ManagedOnlineDeployment,
    Model,
    Environment,
)

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is an online endpoint",
    auth_mode="key",
    tags={
        "training_dataset": "credit_defaults",
        "model_type": "sklearn.GradientBoostingClassifier",
    },
)

endpoint = ml_client.online_endpoints.begin_create_or_update(endpoint).result()

print(f"Endpoint {endpoint.name} provisioning state: {endpoint.provisioning_state}")

Remarque

Attendez-vous à ce que la création du point de terminaison prenne quelques minutes.

Après avoir créé le point de terminaison, récupérez-le comme indiqué dans le code suivant :

endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

print(
    f'Endpoint "{endpoint.name}" with provisioning state "{endpoint.provisioning_state}" is retrieved'
)

Déployer le modèle sur le point de terminaison

Après avoir créé le point de terminaison, déployez le modèle à l’aide du script d’entrée. Chaque point de terminaison peut avoir plusieurs déploiements. Vous pouvez spécifier des règles pour diriger le trafic vers ces déploiements. Dans cet exemple, vous créez un déploiement unique qui gère 100% du trafic entrant. Choisissez un nom de couleur pour le déploiement, tel que bleu, vert ou rouge. Le choix est arbitraire.

Pour trouver la dernière version de votre modèle inscrit, consultez la page Modèles dans Azure Machine Learning Studio. Vous pouvez également utiliser le code suivant pour récupérer le numéro de version le plus récent.

# Let's pick the latest version of the model
latest_model_version = max(
    [int(m.version) for m in ml_client.models.list(name=registered_model_name)]
)
print(f'Latest model is version "{latest_model_version}" ')

Déployez la dernière version du modèle.

# picking the model to deploy. Here we use the latest version of our registered model
model = ml_client.models.get(name=registered_model_name, version=latest_model_version)

# Expect this deployment to take approximately 6 to 8 minutes.
# create an online deployment.
# if you run into an out of quota error, change the instance_type to a comparable VM that is available.
# Learn more on https://azure.microsoft.com/pricing/details/machine-learning/.
blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    instance_type="Standard_DS3_v2",
    instance_count=1,
)

blue_deployment = ml_client.begin_create_or_update(blue_deployment).result()

Remarque

Attendez-vous à ce que ce déploiement prenne environ six à huit minutes.

Une fois le déploiement terminé, vous êtes prêt à le tester.

Tester avec un exemple de requête

Après avoir déployé le modèle sur le point de terminaison, exécutez l’inférence à l’aide du modèle.

Créez un fichier de requête d'exemple qui suit la conception attendue dans la méthode run du script de score.

deploy_dir = "./deploy"
os.makedirs(deploy_dir, exist_ok=True)

%%writefile {deploy_dir}/sample-request.json
{
  "input_data": {
    "columns": [0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22],
    "index": [0, 1],
    "data": [
            [20000,2,2,1,24,2,2,-1,-1,-2,-2,3913,3102,689,0,0,0,0,689,0,0,0,0],
            [10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 10, 9, 8]
        ]
  }
}

# test the blue deployment with some sample data
ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    request_file="./deploy/sample-request.json",
    deployment_name="blue",
)

Nettoyer les ressources

Si vous n’avez pas besoin du point de terminaison, supprimez-le pour arrêter d’utiliser la ressource. Assurez-vous qu’aucun autre déploiement n’utilise un point de terminaison avant de le supprimer.

Remarque

Attendez-vous à ce que la suppression complète prenne environ 20 minutes.

ml_client.online_endpoints.begin_delete(name=online_endpoint_name)

Arrêter l’instance de calcul

Si vous n’en avez pas besoin maintenant, arrêtez l’instance de calcul :

Dans le studio, dans le volet gauche, sélectionnez Calcul.
Dans les onglets du haut, sélectionnez Instances de calcul.
Sélectionnez l’instance de calcul dans la liste.
Dans la barre d’outils supérieure, sélectionnez Arrêter.

Supprimer toutes les ressources

Important

Les ressources que vous avez créées peuvent être utilisées comme prérequis pour d’autres tutoriels d’Azure Machine Learning et des articles de procédure.

Si vous n’avez pas l’intention d’utiliser les ressources que vous avez créées, supprimez-les pour éviter des frais :

Dans la zone de recherche du portail Azure, saisissez Groupes de ressources et sélectionnez cette option dans les résultats.
Dans la liste, sélectionnez le groupe de ressources créé.
Sur la page Vue d’ensemble, cliquez sur Supprimer le groupe de ressources.
Entrez le nom du groupe de ressources. Ensuite, sélectionnez Supprimer.

Étapes suivantes

Effectuer l’apprentissage d’un modèle dans Azure Machine Learning

Explorez d’autres façons de créer avec Azure Machine Learning :

Didacticiel	Descriptif
Charger, accéder et explorer vos données	Stocker des données volumineuses dans le cloud et y accéder à partir de notebooks
Développement de modèles sur une station de travail cloud	Prototyper et développer des modèles de manière interactive
Déployer un modèle en tant que point de terminaison en ligne	Découvrir les configurations de déploiement avancées
Créer des pipelines de production	Créer des flux de travail ML automatisés et réutilisables

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-01-24

Démarrage rapide : Bien démarrer avec Azure Machine Learning

Prérequis

Définir votre noyau et ouvrir dans Visual Studio Code (VS Code)

Créer un descripteur vers l’espace de travail

Créer un script d’entraînement

Configurer la commande

Envoi du travail

Afficher la sortie du travail et attendre l’achèvement du travail

Déployer le modèle en tant que point de terminaison en ligne

Créer un point de terminaison en ligne

Déployer le modèle sur le point de terminaison

Tester avec un exemple de requête

Nettoyer les ressources

Arrêter l’instance de calcul

Supprimer toutes les ressources

Étapes suivantes

Commentaires

Ressources supplémentaires