Présentation du service Analyse d'images

Caution

Le service Analyse d’image 4.0 dans Azure Vision dans Foundry Tools est déconseillé et sera mis hors service le 25 septembre 2028, après quoi les appels effectués au service échoueront. Nous vous recommandons de passer à l’une des alternatives disponibles décrites dans le guide de migration.

Azure Vision dans Foundry Tools Image Analysis service peut extraire une grande variété de fonctionnalités visuelles de vos images. Par exemple, il peut déterminer si une image contient du contenu pour adultes, identifier des marques ou des objets spécifiques, ou trouver des visages humains.

La dernière version de l’analyse d’image, 4.0, qui est désormais en disponibilité générale, propose de nouvelles fonctionnalités telles que la détection synchrone d’OCR et de personnes.

Vous pouvez utiliser le service Analyse d'images via un kit SDK de bibliothèque de client ou en appelant directement l'REST API. Pour vous lancer, suivez le guide de démarrage rapide.

Quickstart

Cette documentation contient les types d’articles suivants :

Les guides de démarrage rapide sont des instructions pas à pas qui vous permettent d’effectuer des appels au service et d’obtenir des résultats en peu de temps.
Les guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique et personnalisée.
Les articles conceptuels fournissent des explications approfondies sur les fonctions et fonctionnalités du service.

Pour une approche plus structurée, suivez un module de formation pour l’analyse d’images.

Analyser des images avec Azure Vision

Versions de l’analyse d’images

Important

Sélectionnez la version de l’API Analyse d’image qui correspond le mieux à vos besoins.

Version	Fonctionnalités disponibles	Recommendation
version 4.0	Lire texte, légendes, légendes denses, balises, détection d’objets, personnes, rognage intelligent	De meilleurs modèles – utilisez la version 4.0 si elle prend en charge votre cas d’usage.
version 3.2	Balises, Objets, Descriptions, Marques, Visages, Type d’image, Jeu de couleurs, Repères, Célébrités, Contenu pour adultes, Rognage intelligent	Un plus grand choix de fonctionnalités – utilisez la version 3.2 si votre cas d’usage n’est pas encore pris en charge dans la version 4.0

Nous vous recommandons d’utiliser l’API Analyse d’images 4.0 si elle prend en charge votre cas d’usage. Utilisez la version 3.2 si votre cas d’usage n’est pas encore pris en charge par la version 4.0.

Vous devez également utiliser la version 3.2 si vous souhaitez effectuer une légende d’images et que votre ressource Vision se trouve en dehors des régions Azure prises en charge. La fonctionnalité de légendes d’images dans Analyse d’image 4.0 est uniquement prise en charge dans certaines régions Azure. Le sous-titrage d’images dans la version 3.2 est disponible dans toutes les régions Azure Vision. Consultez Disponibilité dans les régions.

Analyze Image

Vous pouvez analyser des images pour obtenir des insights sur leurs caractéristiques visuelles et leurs caractéristiques. L’API Analyser l’image fournit toutes les fonctionnalités de ce tableau. Pour commencer, suivez un guide de démarrage rapide.

Name	Description	Page Concept
Personnalisation du modèle (préversion v4.0 uniquement) (déconseillé)	Créez et entraînez des modèles personnalisés pour la classification d’images ou la détection d’objets. Ajoutez vos propres images et étiquetez-les avec des balises personnalisées pour que l’analyse des images forme un modèle personnalisé à votre cas d’usage.	Personnalisation du modèle
Lire le texte des images (v4.0 uniquement)	La préversion de la version 4.0 d’Analyse d’image offre la possibilité d’extraire du texte lisible à partir d’images. Par rapport à l’API Read Vision par ordinateur 3.2 asynchrone, la nouvelle version offre le moteur OCR Read habituel dans une API synchrone unifiée et aux performances avancées, ce qui permet d’obtenir facilement l’OCR ainsi que d’autres informations dans une seule opération d’API.	OCR pour les images
Détecter les personnes dans des images (v4.0 uniquement)	La version 4.0 de l’analyse d’image offre la possibilité de détecter les personnes apparaissant dans des images. L’API retourne les coordonnées du cadre englobant chaque personne détectée, ainsi qu’un score de confiance.	Détection des visages
Générer des légendes d’image	Générez la légende d’une image dans un langage explicite, en utilisant des phrases complètes. Les algorithmes du service Vision par ordinateur génèrent différentes légendes selon les objets identifiés dans l’image. La version 4.0 du modèle de légende d’images est une implémentation plus avancée et fonctionne avec une gamme plus large d’images d’entrée. Elle est disponible uniquement dans certaines régions géographiques. Consultez Disponibilité dans les régions. La version 4.0 vous permet également d’utiliser la légende dense, qui génère des légendes détaillées pour les objets individuels qui se trouvent dans l’image. L’API retourne les coordonnées du cadre englobant (en pixels) de chaque objet trouvé dans l’image accompagné d’une légende. Vous pouvez utiliser cette fonctionnalité pour générer des descriptions de parties distinctes d’une image.	Générer des légendes d’image (v3.2) (v4.0)
Détecter des objets	La détection d’objets est similaire au balisage, mais l’API retourne les coordonnées de cadre englobant pour chaque balise appliquée. Par exemple, si une image contient un chien, un chat et une personne, l’opération Détecter répertorie ces objets avec leurs coordonnées dans l’image. Vous pouvez utiliser cette fonctionnalité pour traiter d’autres relations entre les objets dans une image. Elle vous permet également de savoir quand il existe plusieurs instances de la même balise dans une image.	Détecter des objets (v3.2) (v4.0)
Identifier les composants visuels à l’aide de balises	Identifier les composants visuels d’une image et les marquer à l’aide de balises à partir d’un ensemble de milliers d’objets, d’êtres vivants, de scènes et d’actions reconnaissables. Quand les étiquettes sont ambigües ou inhabituelles, la réponse de l’API fournit des conseils pour clarifier le contexte de l’étiquette. Le balisage ne se limite pas au sujet principal, comme une personne au premier plan, mais il inclut également le décor (intérieur ou extérieur), le mobilier, les outils, les plantes, les animaux, les accessoires, les gadgets, etc.	Étiqueter des fonctionnalités visuelles (v3.2) (v4.0)
Obtenir la zone d’intérêt / la culture intelligente	Analysez le contenu d’une image pour retourner les coordonnées de la zone d’intérêt qui correspond à un rapport d’aspect spécifié. Le service Vision par ordinateur retourne les coordonnées de cadre englobant de la région pour que l’application appelante puisse modifier l’image d’origine de la manière souhaitée. La version 4.0 du modèle de rognage intelligent est une implémentation plus avancée et fonctionne avec une gamme plus large d’images d’entrée. Elle est disponible uniquement dans certaines régions géographiques. Consultez Disponibilité dans les régions.	Générer une miniature (v3.2) (préversion v4.0)
Détecter des marques (v3.2 uniquement)	Identifiez les marques commerciales dans les images ou vidéos à partir d’une base de données de milliers de logos internationaux. Vous pouvez utiliser cette fonctionnalité, par exemple, pour déterminer quelles marques sont les plus populaires sur les réseaux sociaux ou celles qui prédominent dans le placement de produits médiatiques.	Détecter les marques
Catégoriser une image (v3.2 uniquement)	Identifier et catégoriser une image dans son ensemble en utilisant une taxonomie des catégories comprenant des hiérarchies héréditaires parent/enfant. Les catégories peuvent être utilisées seules ou avec nos nouveaux modèles de balisage. Actuellement, l’anglais est la seule langue prise en charge pour le balisage et la catégorisation des images.	Catégoriser une image
Détecter des visages (v3.2 uniquement)	Détecter les visages dans une image et fournir des informations sur chaque visage détecté. Azure Vision retourne les coordonnées, le rectangle, le sexe et l’âge pour chaque visage détecté. Vous pouvez également utiliser l’API Visage dédiée à ces fins. Elle offre une analyse plus détaillée (reconnaissance faciale, détection de la posture, etc.).	Détecter les visages
Détecter des types d’images (v3.2 uniquement)	Détecter les caractéristiques relatives à une image, par exemple si une image est un dessin au trait ou s’il pourrait s’agir d’une image clipart.	Détecter les types d’images
Détecter du contenu spécifique à un domaine (v.3.2 uniquement)	Utiliser des modèles de domaine pour détecter et identifier le contenu spécifique à un domaine dans une image, notamment pour reconnaître des célébrités ou des éléments géographiques. Par exemple, si une image contient des personnes, Azure Vision peut utiliser un modèle de domaine pour les célébrités afin de déterminer si les personnes détectées dans l’image sont des célébrités connues.	Détecter le contenu spécifique à un domaine
Détecter le modèle de couleurs (v3.2 uniquement)	Analyser l’utilisation des couleurs dans une image. Azure Vision peut déterminer si une image est noire et blanche ou couleur et, pour les images de couleur, identifiez les couleurs dominantes et d’accentuation.	Détecter le jeu de couleurs
Modérer du contenu dans des images (v3.2 uniquement)	Utilisez Azure Vision pour détecter le contenu adulte dans une image et retourner des scores de confiance pour différentes classifications. Le seuil de marquage du contenu peut être défini sur une échelle pour prendre en compte vos préférences.	Détecter du contenu pour adultes

Reconnaissance de produits (préversion v4.0 uniquement) (déconseillé)

Important

Cette fonctionnalité est désormais supprimée. Le 31 mars 2025, l’API Azure AI Image Analysis 4.0 Custom Image Classification, Custom Object Detection et Product Recognition preview ont été supprimées. Les appels d’API à ces services échouent.

Passez à Azure AI Custom Vision, qui est désormais en disponibilité générale. Custom Vision offre des fonctionnalités similaires à ces fonctionnalités mises hors services.

Les API Reconnaissance de produits vous permettent d’analyser des photos d’étagères dans un magasin de vente au détail. Vous pouvez détecter la présence ou l’absence de produits et obtenir leurs coordonnées de cadre englobant. Utilisez-la en combinaison avec la personnalisation du modèle pour entraîner un modèle afin d’identifier vos produits spécifiques. Vous pouvez également comparer les résultats de la reconnaissance de produits au document de planogramme de votre magasin.

Reconnaissance de produits

Incorporations multimodales (v4.0 uniquement)

Les API d’incorporations multimodales permettent la vectorisation des images et des requêtes de texte. Ils convertissent des images en coordonnées dans un espace vectoriel multidimensionnel. Ensuite, vous pouvez convertir des requêtes de texte entrantes en vecteurs et faire correspondre des images au texte en fonction de la proximité sémantique. Cette fonctionnalité vous permet de rechercher un ensemble d’images à l’aide de texte, sans avoir besoin d’utiliser des balises d’image ou d’autres métadonnées. La proximité sémantique produit souvent de meilleurs résultats dans la recherche.

L’API 2024-02-01 inclut un modèle multilingue qui prend en charge la recherche de texte dans 102 langues. Le modèle anglais d’origine est toujours disponible, mais vous ne pouvez pas le combiner avec le nouveau modèle dans le même index de recherche. Si vous avez vectorisé du texte et des images à l’aide du modèle anglais uniquement, ces vecteurs ne sont pas compatibles avec les vecteurs de texte et d’image multilingues.

Ces API sont uniquement disponibles dans certaines régions géographiques. Consultez Disponibilité dans les régions.

Incorporations multimodales

Suppression de l’arrière-plan (préversion v4.0 uniquement)

Important

Cette fonctionnalité est désormais supprimée. Le 31 mars 2025, l’API Azure AI Image Analysis 4.0 Segment et le service de suppression d’arrière-plan ont été mis hors service. Les appels d’API à ces services échouent.

La fonctionnalité de segmentation du modèle open source Florence 2 pourrait répondre à vos besoins. Elle retourne une carte alpha marquant la différence entre le premier plan et l’arrière-plan, mais elle ne modifie pas l’image originale pour supprimer l’arrière-plan. Installez le modèle Florence 2 et essayez sa fonctionnalité de segmentation par région.

Pour une fonctionnalité de suppression complète de l’arrière-plan, envisagez un utilitaire tiers comme BiRefNet.

Limites du service

Analyse d'images fonctionne sur les images qui répondent aux exigences suivantes :

L’image doit être au format JPEG, PNG, GIF, BMP, WEBP, ICO, TIFF ou MPO
La taille de fichier de l’image doit être inférieure à 20 mégaoctets (Mo)
Les dimensions de l’image doivent être supérieures à 50 x 50 pixels et inférieures à 16 000 x 16 000 pixels

Tip

Les exigences d’entrée pour les incorporations modales sont différentes et sont répertoriées dans les incorporations modales.

Assistance linguistique

Différentes fonctionnalités d’Analyse d’image sont disponibles dans différentes langues. Consultez la page Prise en charge des langues.

Disponibilité de la région

Pour utiliser les API Analyse d’images, vous devez créer votre ressource Azure Vision dans Foundry Tools dans une région prise en charge. Les fonctionnalités d’Analyse d’image sont disponibles dans les régions suivantes :

Region	Analyze Image (moins Sous-titres 4.0)	Analyze Image (y compris Sous-titres 4.0)	Reconnaissance de produits	Incorporations multimodales
East US	✅	✅	✅	✅
West US	✅	✅		✅
Ouest des États-Unis 2	✅		✅	✅
France Central	✅	✅		✅
North Europe	✅	✅		✅
West Europe	✅	✅		✅
Sweden Central	✅			✅
Switzerland North	✅			✅
Australia East	✅			✅
Southeast Asia	✅	✅		✅
East Asia	✅	✅
Korea Central	✅	✅		✅
Japan East	✅			✅

Sécurité et confidentialité des données

Comme avec tous les outils Foundry, les développeurs qui utilisent le service Azure Vision doivent connaître les stratégies de Microsoft sur les données client. Pour en savoir plus, consultez la page Outils Foundry sur le Centre de confiance Microsoft.

Étapes suivantes

Pour vous familiariser avec Analyse d’images, suivez le guide de démarrage rapide correspondant à votre langage de développement et à votre API préférés :

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2025-09-26

Présentation du service Analyse d'images

Versions de l’analyse d’images

Analyze Image

Reconnaissance de produits (préversion v4.0 uniquement) (déconseillé)

Incorporations multimodales (v4.0 uniquement)

Suppression de l’arrière-plan (préversion v4.0 uniquement)

Limites du service

Critères des entrées

Assistance linguistique

Disponibilité de la région

Sécurité et confidentialité des données

Étapes suivantes

Commentaires

Ressources supplémentaires