Étiqueter et entraîner un modèle personnalisé

Effectué

Une fois que vous avez chargé vos images dans le stockage d’objets blob et créé votre jeu de données, l’étape suivante consiste à étiqueter vos images et à connecter le fichier COCO résultant. Si vous disposez déjà d’un fichier COCO pour vos images d’entraînement, vous pouvez ignorer l’étape d’étiquetage.

Étiquetage de vos images d’entraînement

L’étiquetage de vos images d’apprentissage est effectué dans Azure Machine Learning Studio à l’aide du projet d’étiquetage des données. Avoir des étiquettes complètes et précises pour vos images d’entraînement améliore considérablement les performances de votre modèle entraîné. Lorsque vous étiquetez vos images, veillez à affecter avec précision des étiquettes et à étiqueter complètement toutes les instances de chaque classe.

Dans votre jeu de données dans Vision Studio, créez un projet d’étiquetage des données Azure Machine Learning ou connectez-vous à un projet existant si vous en avez créé un dans Azure Machine Learning Studio.

Screenshot of a new dataset in Vision Studio custom model project.

Une fois votre projet créé, ce bouton vous permet d’accéder à Azure Machine Learning Studio et d’ouvrir le projet d’étiquetage. Dans Azure Machine Learning Data Labeling, vous pouvez ajouter des catégories pour vos images ou objets (par exemple pomme, orange, banane). Une fois que vous avez des catégories, démarrez votre projet et accédez à l’onglet Étiquetage. Vous devez étiqueter 3 à 5 images par catégorie.

Screenshot of a labeling fruit in Azure Machine Learning Studio.

Il existe des outils avec Azure Machine Learning pour vous aider à étiqueter, comme l’étiquetage assisté par ML qui prend certaines étiquettes que vous fournissez pour un sous-ensemble des images et tente d’étiqueter les images restantes pour vous. Si vous utilisez ces fonctionnalités, il est important de passer en revue les étiquettes pour vous assurer qu’elles sont exactes. S’ils ne sont pas précis, les performances de votre modèle entraîné diminuent.

Lorsque l’étiquetage est terminé et que toutes les images d’apprentissage sont correctement classifiées ou étiquetées, vous pouvez ajouter votre fichier COCO à votre jeu de données directement à partir de votre espace de travail Azure Machine Learning.

Entraînement de votre modèle

Avec toutes les images d’entraînement étiquetées, l’étape suivante consiste à entraîner votre modèle. Lorsque vous entraînez un modèle, sélectionnez le type de modèle, spécifiez le jeu de données que vous souhaitez utiliser comme données d’apprentissage et indiquez le budget d’entraînement. Le budget de formation est une limite supérieure du temps pendant lequel la formation s’exécutera ; le temps réel utilisé pour l’entraînement est souvent inférieur au budget spécifié.

Une fois votre modèle entraîné, le fait de le sélectionner vous permet d’afficher les performances de l’exécution d’évaluation. Si un jeu de données d’évaluation n’est pas fourni lors de l’entraînement de votre modèle, il utilise l’exécution d’évaluation par défaut. L’exécution d’évaluation par défaut prend un petit ensemble d’images étiquetées hors du jeu d’entraînement, utilise le modèle entraîné pour les prédictions sur ce sous-ensemble et compare les prédictions aux étiquettes fournies.

À partir de la page de modèle entraîné, vous pouvez déclencher de nouvelles exécutions d’évaluation sur un autre ensemble d’images ou tester vos propres tests dans Vision Studio en sélectionnant l’onglet en haut de la page.