Soumettre un travail d’apprentissage dans Studio

Article
10/16/2024

Il existe de nombreuses façons de créer un travail d’apprentissage avec Azure Machine Learning. Vous pouvez utiliser l’interface CLI (voir Entraîner des modèles (créer des travaux)), l’API REST (voir Entraîner des modèles avec REST (préversion)) ou utiliser l’interface utilisateur pour créer directement un travail d’apprentissage. Dans cet article, vous apprenez à utiliser vos propres données et code pour entraîner un modèle Machine Learning avec une expérience guidée pour soumettre des travaux d’entraînement dans Azure Machine Learning studio.

Important

Cette fonctionnalité est actuellement disponible en préversion publique. Cette préversion est fournie sans contrat de niveau de service et n’est pas recommandée pour les charges de travail de production. Certaines fonctionnalités peuvent être limitées ou non prises en charge.

Pour plus d’informations, consultez Conditions d’Utilisation Supplémentaires relatives aux Évaluations Microsoft Azure.

Prérequis

Un abonnement Azure. Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer. Essayez la version gratuite ou payante d’Azure Machine Learning dès aujourd’hui.
Un espace de travail Azure Machine Learning. Consultez Créer des ressources d’espace de travail.
Compréhension de ce qu’est un travail dans Azure Machine Learning. Consultez comment entraîner des modèles.

Bien démarrer

Connectez-vous à Azure Machine Learning Studio.
Sélectionnez votre abonnement et votre espace de travail.

Vous pouvez accéder à l’interface utilisateur de création d’un travail à partir de la page d’accueil. Sélectionnez Créer nouveau, puis Travail.

Dans cette étape, vous pouvez sélectionner votre méthode d’entraînement, renseigner le reste du formulaire de soumission en fonction de votre sélection et soumettre le travail d’entraînement. Ci-dessous, nous parcourons le formulaire en suivant les étapes pour exécuter un script personnalisé (travail de commande).

Configurer les paramètres de base

La première étape consiste à configurer des informations de base sur votre travail d’apprentissage. Vous pouvez ensuite continuer si vous êtes satisfait des valeurs par défaut que nous avons choisies pour vous, ou apporter des modifications en fonction de ce que vous préférez.

Voici les champs disponibles :

Champ	Description
Nom du travail	Le champ Nom du travail est utilisé pour identifier votre travail de façon unique. Il est également utilisé comme nom d’affichage pour votre travail.
Nom de l'expérience	Il permet d’organiser le travail dans Azure Machine Learning Studio. L’enregistrement d’exécution de chaque travail est organisé sous l’expérience correspondante sous l’onglet « Expérience » du studio. Par défaut, Azure place le travail dans l’expérience Par défaut.
Description	Ajoutez du texte décrivant votre travail, si vous le souhaitez.
Délai d'expiration	Spécifiez le nombre d’heures pendant lesquelles l’ensemble du travail d’apprentissage est autorisé à s’exécuter. Une fois cette limite atteinte, le système annule le travail, y compris tous ses travaux enfants.
Balises	Ajoutez des balises à votre travail pour faciliter l’organisation.

Script d’entraînement

La prochaine étape consiste à charger votre code source, configurez les entrées ou sorties nécessaires à l’exécution du travail d’apprentissage, et spécifiez la commande d’exécution de votre script d’apprentissage.

Il peut s’agir d’un fichier de code ou d’un dossier à partir de votre stockage d’objets blob par défaut de votre ordinateur local ou de votre espace de travail. Azure affiche les fichiers à charger une fois votre sélection effectuée.

Champ	Description
Code	Il peut s’agir d’un fichier ou d’un dossier à partir du stockage d’objets blob par défaut de votre ordinateur local ou de votre espace de travail en tant que script d’apprentissage. Studio affiche les fichiers à charger une fois votre sélection effectuée.
Entrées	Spécifiez autant d’entrées que nécessaire pour les types suivants : données, entier, nombre, booléen, chaîne).
Commande	Commande à exécuter. Les arguments de ligne de commande peuvent être écrits explicitement dans la commande ou déduits à partir d’autres sections, en particulier des entrées, en utilisant une notation d’accolades, comme indiqué dans la section suivante

Code

La commande est exécutée à partir du répertoire racine du dossier de code téléchargé. Après avoir sélectionné votre fichier de code ou dossier, vous pouvez afficher les fichiers à charger. Copiez le chemin d’accès relatif au code contenant votre point d’entrée, puis collez-le dans la zone intitulée Entrer la commande pour démarrer le travail.

Si le code se trouve dans le répertoire racine, vous pouvez y faire directement référence dans la commande. Par exemple, python main.py.

Si le code ne se trouve pas dans le répertoire racine, vous devez utiliser le chemin d’accès relatif. Par exemple, la structure du modèle de langage Word est la suivante :

.
├── job.yml
├── data
└── src
    └── main.py

Ici, le code source se trouve dans le sous-répertoire src. La commande correspond à python ./src/main.py (plus d’autres arguments de ligne de commande).

Entrées

Lorsque vous utilisez une entrée dans la commande, vous devez spécifier le nom de l’entrée. Pour indiquer une variable d’entrée, utilisez le formulaire ${{inputs.input_name}}. Par exemple, ${{inputs.wiki}}. Vous pouvez ensuite y faire référence dans la commande, par exemple, --data ${{inputs.wiki}}.

Sélectionner les ressources de calcul

La prochaine étape consiste à sélectionner la cible de calcul sur laquelle vous souhaitez exécuter votre travail. L’interface utilisateur de création d’un travail prend en charge plusieurs types de calcul :

Type de calcul	Introduction
Instance de calcul	Qu’est-ce qu’une instance de calcul Azure Machine Learning ?
Cluster de calcul	Qu’est-ce qu’un cluster de calcul ?
Calcul connecté (cluster Kubernetes)	Configurer et attacher des clusters Kubernetes en tout lieu (préversion).

Sélectionner un type de calcul
Sélectionnez une ressource de calcul existante. La liste déroulante affiche les informations de nœud et le type de référence SKU pour faciliter votre choix.
Pour un cluster de calcul ou un cluster Kubernetes, vous pouvez également spécifier le nombre de nœuds que vous souhaitez pour le travail dans Nombre d’instances. Le nombre d’instances par défaut est 1.
Lorsque vous êtes satisfait de vos choix, sélectionnez Suivant.

Si vous utilisez Azure Machine Learning pour la première fois, vous voyez une liste vide ainsi qu’un lien permettant de créer un calcul. Pour plus d’informations sur la création des différents types, consultez :

Type de calcul	Guides pratiques
Instance de calcul	Créer une instance de calcul Azure Machine Learning
Cluster de calcul	Créer un cluster de calcul Azure Machine Learning
Cluster Kubernetes attaché	Attacher un cluster Kubernetes avec Azure Arc

Spécifier l’environnement nécessaire

Après avoir sélectionné une cible de calcul, vous devez spécifier l’environnement d’exécution de votre travail. L’interface utilisateur de création d’un travail prend en charge trois types d’environnements :

Environnements organisés
Environnements personnalisés
Image de registre de conteneurs

Environnements organisés

Les environnements organisés sont des collections définies par Azure des packages Python utilisés dans les charges de travail ML courantes. Les environnements organisés sont disponibles dans votre espace de travail par défaut. Ces environnements s’appuient sur des images Docker mises en cache, ce qui réduit la charge de préparation du travail. Les cartes affichées dans la page « Environnements organisés » affichent les détails de chaque environnement. Pour en savoir plus, consultez les environnements organisés dans Azure Machine Learning.

Environnements personnalisés

Les environnements personnalisés sont des environnements que vous avez spécifiés vous-même. Vous pouvez spécifier un environnement ou réutiliser un environnement que vous avez déjà créé. Pour plus d’informations, consultez Gérer des environnements logiciels dans Azure Machine Learning Studio (préversion).

Image de registre de conteneurs

Si vous ne souhaitez pas utiliser les environnements organisés Azure Machine Learning ou si vous spécifiez votre propre environnement personnalisé, vous pouvez utiliser une image Docker à partir d’un registre de conteneurs public, tel que Docker Hub.

Vérifier et créer

Après avoir configuré le travail, sélectionnez Suivant pour accéder à la page Vérifier. Pour modifier un paramètre, sélectionnez l’icône en forme de crayon et apportez la modification souhaitée.

Pour lancer le travail, choisissez Soumettre le travail d’apprentissage. Une fois le travail créé, Azure affiche la page des détails de celui-ci, sur laquelle vous pouvez surveiller et gérer votre travail d’entraînement.

Comment configurer des e-mails dans studio

Pour commencer à recevoir des e-mails lorsque votre travail, point de terminaison en ligne ou point de terminaison de lot est terminé ou s’il existe un problème (échec, annulation), suivez les instructions suivantes :

Dans Azure ML Studio, accédez aux paramètres en sélectionnant l’icône d’engrenage.
Sélectionnez l’onglet Notifications par e-mail.
Activez ou désactivez les notifications par e-mail pour un événement spécifique.

Capture d’écran des paramètres d’Azure ML Studio sous l’onglet Notifications par e-mail.

Partager via