Démarrage rapide : Créer un modèle de classification d’images avec le portail Custom Vision
Dans ce guide de démarrage rapide, vous allez découvrir comment utiliser le portail web Custom Vision pour créer un modèle de classification d’images. Une fois que vous avez créé un modèle, vous pouvez le tester avec de nouvelles images et l’intégrer finalement à votre propre application de reconnaissance d’images.
Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer.
Prérequis
- Un ensemble d’images avec lequel entraîner votre modèle de classification. Vous pouvez utiliser l’ensemble d’exemples d’images disponible sur GitHub, ou choisir vos propres images à l’aide des conseils ci-dessous.
- Un navigateur web pris en charge
Créer des ressources Custom Vision
Pour utiliser le service Custom Vison, vous devez créer des ressources de formation et de prédiction Custom Vision dans Azure. Pour ce faire, dans le portail, remplissez la boîte de dialogue de la page de création Custom Vision pour créer une ressource de formation et une ressource de prédiction.
Création d'un projet
Dans votre navigateur web, accédez à la page web Custom Vision et sélectionnez Sign in (Se connecter). Connectez-vous avec le même compte que celui utilisé pour vous connecter au portail Azure.
Pour créer votre premier projet, sélectionnez New Project (Nouveau projet). La boîte de dialogue Créer un projet s’affiche.
Entrez un nom et une description pour le projet. Sélectionnez ensuite votre ressource de formation Custom Vision. Si votre compte connecté est associé à un compte Azure, le menu déroulant Ressource affiche toutes les ressources Azure compatibles.
Remarque
Si aucune ressource n’est disponible, vérifiez que vous vous êtes connecté à customvision.ai avec le même compte que celui utilisé pour vous connecter au portail Azure. Vérifiez aussi que vous avez sélectionné le même « Répertoire » dans le site web Custom Vision que celui du portail Azure où se trouvent vos ressources Custom Vision. Dans les deux sites, vous pouvez sélectionner votre répertoire à partir du menu déroulant de compte situé en haut à droite de l’écran.
Sélectionnez Classification sous Project Types (Types de projets). Ensuite, sous Classification Types (Types de classifications), choisissez Multilabel (Multi-étiquette) ou Multiclass (Multiclasse), en fonction de votre cas d’utilisation. La classification multi-étiquette applique un nombre quelconque de vos étiquettes à une image (zéro ou plus), tandis que la classification multiclasse trie les images et les classe dans une seule catégorie (chaque image que vous soumettez se voit appliquer l’étiquette la plus probable). Vous pourrez changer ultérieurement le type de classification si vous le souhaitez.
Sélectionnez ensuite un des domaines disponibles. Chaque domaine optimise le modèle pour des types spécifiques d’images, comme décrit dans le tableau suivant. Vous pouvez changer de domaine ultérieurement si vous le souhaitez.
Domain Objectif Générique Optimisé pour un large éventail de tâches de classification d’images. Si aucun autre domaine n’est approprié, ou si vous hésitez sur le choix du domaine, sélectionnez le domaine Générique. Food (Nourriture) Optimisé pour les photographies de plats, tels que vous pouvez les voir dans un menu de restaurant. Si vous souhaitez classer des photographies de fruits ou de légumes distincts, utilisez le domaine Food (Nourriture). Landmarks (Monuments et sites) Optimisé pour les monuments et sites reconnaissables, naturels et artificiels. Ce domaine fonctionne mieux lorsque le monument ou le site est clairement visible dans la photographie. Ce domaine fonctionne même si le monument ou le site est légèrement masqué par des personnes placées devant lui. Retail (Commerce) Optimisé pour les images qui se trouvent dans des catalogues de vente ou sur des site Web commerciaux. Si vous souhaitez un classement de grande précision pour des robes, des pantalons et des chemises, utilisez ce domaine. Compact Domains (Domaines compacts) Optimisés en fonction des contraintes de la classification en temps réel sur les appareils mobiles. Les modèles générés par les domaines compacts sont exportables pour s’exécuter localement. Enfin, sélectionnez Create project (Créer le projet).
Choisir les images d’entraînement
Nous vous recommandons d’utiliser au moins 30 images par étiquette dans le jeu d’entraînement initial. Vous allez également collecter quelques images supplémentaires pour tester votre modèle une fois qu’il est entraîné.
Pour entraîner votre modèle efficacement, utilisez des images avec une variété de visuels. Sélectionnez des images dont les éléments suivants varient :
- angle de l’appareil photo
- éclairage
- background
- style de visuel
- objets individuels/groupés
- taille
- type
En outre, vérifiez que toutes vos images d’entraînement respectent les critères suivants :
- format .jpg, .png, .bmp ou .gif
- taille ne dépassant pas 6 Mo (4 Mo pour les images de prédiction)
- le côté le plus court ne doit pas comporter moins de 256 pixels ; les images d’une dimension inférieure sont automatiquement mises à l’échelle par le service Vision personnalisée
Charger et étiqueter des images
Dans cette section, vous allez télécharger et étiqueter manuellement des images pour faciliter l’apprentissage du classifieur.
Pour ajouter des images, sélectionnez Ajouter des images, puis Parcourir les fichiers locaux. Sélectionnez Open (Ouvrir) pour passer à l’étiquetage. La sélection des étiquettes est appliquée à l’ensemble d’un groupe d’images que vous avez choisi de télécharger. Nous vous recommandons donc de télécharger les images dans des groupes distincts correspondant aux étiquettes que vous souhaitez leur attribuer. Il est également possible de modifier individuellement les étiquettes des images après leur téléchargement.
Pour créer une étiquette, entrez du texte dans le champ My Tags (Mes étiquettes) et appuyez sur Entrée. Si l’étiquette existe déjà, elle apparaît dans un menu déroulant. Dans un projet multi-étiquette, vous pouvez ajouter plusieurs étiquettes à vos images, mais dans un projet multiclasse, vous ne pouvez en ajouter qu’une seule. Pour terminer le chargement des images, utilisez le bouton Upload [nombre] files (Charger [nombre] fichiers).
Une fois les images téléchargées, sélectionnez Terminé.
Pour charger un autre ensemble d’images, revenez en haut de cette section et répétez les étapes.
Former le classifieur
Pour former le classifieur, sélectionnez le bouton Train (Entraîner). Le classifieur utilise toutes les images pour créer un modèle qui identifie les qualités visuelles de chaque étiquette. Ce processus peut prendre plusieurs minutes.
Le processus d’entraînement ne doit durer que quelques minutes. Pendant ce temps, des informations sur le processus d’entraînement s’affichent dans l’onglet Performance.
Évaluer le classifieur
Une fois l’entraînement terminé, les performances du modèle sont estimées et affichées. Le service Custom Vision utilise les images que vous avez soumises pour l’entraînement afin de calculer la précision et le rappel. La précision et le rappel sont deux mesures différentes de l’efficacité d’un classifieur :
- La précision indique la proportion des classifications identifiées qui étaient correctes. Par exemple, si le modèle a identifié 100 images comme étant des chiens et que 99 d’entre elles étaient effectivement des chiens, la précision est de 99 %.
- Le rappel indique la proportion des classifications réelles qui ont été correctement identifiées. Par exemple, s’il y avait 100 images de pommes et que le modèle en a identifié 80 comme étant des pommes, le rappel est de 80 %.
Seuil de probabilité
Notez le curseur Probability Threshold (Seuil de probabilité) dans le volet gauche de l’onglet Performance. Il s’agit du niveau de confiance qu’une prédiction doit avoir pour être considérée comme correcte (dans le cadre du calcul de la précision et du rappel).
Quand vous interprétez des appels de prédiction avec un seuil de probabilité élevé, ils ont tendance à retourner des résultats avec une précision élevée au détriment des rappels ; les classifications détectées sont correctes, mais beaucoup restent non détectées. Un seuil de probabilité faible a l’effet opposé : la plupart des classifications réelles sont détectées, mais il y a plus de faux positifs dans ce jeu. En ayant ceci à l’esprit, vous devez définir le seuil de probabilité en fonction des besoins spécifiques de votre projet. Ultérieurement, lors de la réception des résultats de la prédiction côté client, vous devez utiliser la même valeur de seuil de probabilité que celle utilisée ici.
Gérer les itérations d’entraînement
Chaque fois que vous entraînez votre classifieur, vous créez une nouvelle itération avec ses propres métriques de performances mises à jour. Vous pouvez afficher toutes vos itérations dans le volet gauche de l’onglet Performance. Vous trouvez également le bouton Supprimer, que vous pouvez utiliser pour supprimer une itération si elle est obsolète. Quand vous supprimez une itération, vous supprimez également toutes les images qui lui sont spécifiquement associées.
Consultez Utiliser votre modèle avec l’API de prédiction pour apprendre à accéder à vos modèles entraînés par programmation.
Étapes suivantes
Dans ce guide de démarrage rapide, vous avez découvert comment créer et entraîner un modèle de classification d’images avec le portail web Custom Vision. Vous obtenez ensuite plus d’informations sur le processus itératif d’amélioration de votre modèle.