Analyze Image - Analyze Image
Cette opération extrait un ensemble complet de fonctionnalités visuelles basées sur le contenu de l’image. Deux méthodes d’entrée sont prises en charge : (1) Chargement d’une image ou (2) spécifiant une URL d’image. Dans votre demande, il existe un paramètre facultatif pour vous permettre de choisir les fonctionnalités à retourner. Par défaut, les catégories d’images sont retournées dans la réponse. Une réponse réussie est retournée au format JSON. Si la demande a échoué, la réponse contient un code d’erreur et un message pour vous aider à comprendre ce qui s’est passé.
POST {Endpoint}/vision/v3.2/analyze
POST {Endpoint}/vision/v3.2/analyze?visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}&model-version={model-version}
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
Endpoint
|
path | True |
string |
Points de terminaison Cognitive Services pris en charge. |
description
|
query |
Désactivez les modèles de domaine spécifiés lors de la génération de la description. |
||
details
|
query |
Details[] |
Chaîne indiquant les détails spécifiques au domaine à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de caractéristiques visuelles valides sont les suivants : Célébrités - identifie les célébrités si elles sont détectées dans l’image, Repères - identifie les repères notables dans l’image. |
|
language
|
query |
string |
Langage souhaité pour la génération de sortie. Si ce paramètre n’est pas spécifié, la valeur par défaut est « en ». Consultez https://aka.ms/cv-languages pour obtenir la liste des langues prises en charge. |
|
model-version
|
query |
string pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$ |
Paramètre facultatif pour spécifier la version du modèle IA. Les valeurs acceptées sont les suivantes : « latest », « 2021-04-01 », « 2021-05-01 ». La valeur par défaut est « latest ». |
|
visual
|
query |
Chaîne indiquant les types de caractéristiques visuelles à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de fonctionnalités visuelles valides sont les suivants : Catégories : catégorise le contenu d’image en fonction d’une taxonomie définie dans la documentation. Balises : balise l’image avec une liste détaillée de mots liés au contenu de l’image. Description : décrit le contenu de l’image avec une phrase anglaise complète. Visages : détecte si des visages sont présents. S’il est présent, générez des coordonnées, un sexe et un âge. ImageType : détecte si l’image est clipart ou un dessin de trait. Couleur : détermine la couleur d’accentuation, la couleur dominante et si une image est noire&blanc. Adulte - détecte si l’image est pornographique dans la nature (représente nudité ou acte sexuel) ou est gory (représente la violence extrême ou le sang). Le contenu sexuellement suggestif (contenu racé) est également détecté. Objets : détecte différents objets au sein d’une image, y compris l’emplacement approximatif. L’argument Objects est disponible uniquement en anglais. Marques : détecte différentes marques au sein d’une image, y compris l’emplacement approximatif. L’argument Brands est disponible uniquement en anglais. |
En-tête de la demande
Nom | Obligatoire | Type | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Corps de la demande
Nom | Obligatoire | Type | Description |
---|---|---|---|
url | True |
string |
URL accessible publiquement d’une image. |
Réponses
Nom | Type | Description |
---|---|---|
200 OK |
La réponse inclut les fonctionnalités extraites au format JSON. Voici les définitions des types d’énumération : ClipartType Non - Clipart = 0, ambigu = 1, normal - clipart = 2, good - clipart = 3. LineDrawingTypeNon - LineDrawing = 0, LineDrawing = 1. |
|
Other Status Codes |
Réponse d’erreur. |
Sécurité
Ocp-Apim-Subscription-Key
Type:
apiKey
Dans:
header
Exemples
Successful AnalyzeImage request
Exemple de requête
POST https://westus.api.cognitive.microsoft.com/vision/v3.2/analyze?visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en
{
"url": "{url}"
}
Exemple de réponse
{
"categories": [
{
"name": "abstract_",
"score": 0.00390625
},
{
"name": "people_",
"score": 0.83984375,
"detail": {
"celebrities": [
{
"name": "Satya Nadella",
"faceRectangle": {
"left": 597,
"top": 162,
"width": 248,
"height": 248
},
"confidence": 0.999028444
}
]
}
},
{
"name": "building_",
"score": 0.984375,
"detail": {
"landmarks": [
{
"name": "Forbidden City",
"confidence": 0.9829016923904419
}
]
}
}
],
"adult": {
"isAdultContent": false,
"isRacyContent": false,
"isGoryContent": false,
"adultScore": 0.0934349000453949,
"racyScore": 0.06861349195241928,
"goreScore": 0.012872257380997575
},
"tags": [
{
"name": "person",
"confidence": 0.9897908568382263
},
{
"name": "man",
"confidence": 0.9449388980865479
},
{
"name": "outdoor",
"confidence": 0.938492476940155
},
{
"name": "window",
"confidence": 0.8951393961906433
},
{
"name": "pangolin",
"confidence": 0.7250059783791661,
"hint": "mammal"
}
],
"description": {
"tags": [
"person",
"man",
"outdoor",
"window",
"glasses"
],
"captions": [
{
"text": "Satya Nadella sitting on a bench",
"confidence": 0.48293603002174407
}
]
},
"requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
"metadata": {
"width": 1500,
"height": 1000,
"format": "Jpeg"
},
"modelVersion": "2021-04-01",
"faces": [
{
"age": 44,
"gender": "Male",
"faceRectangle": {
"left": 593,
"top": 160,
"width": 250,
"height": 250
}
}
],
"color": {
"dominantColorForeground": "Brown",
"dominantColorBackground": "Brown",
"dominantColors": [
"Brown",
"Black"
],
"accentColor": "873B59",
"isBWImg": false
},
"imageType": {
"clipArtType": 0,
"lineDrawingType": 0
},
"objects": [
{
"rectangle": {
"x": 0,
"y": 0,
"w": 50,
"h": 50
},
"object": "tree",
"confidence": 0.9,
"parent": {
"object": "plant",
"confidence": 0.95
}
}
],
"brands": [
{
"name": "Pepsi",
"confidence": 0.857,
"rectangle": {
"x": 489,
"y": 79,
"w": 161,
"h": 177
}
},
{
"name": "Coca-Cola",
"confidence": 0.893,
"rectangle": {
"x": 216,
"y": 55,
"w": 171,
"h": 372
}
}
]
}
Définitions
Nom | Description |
---|---|
Adult |
Objet décrivant si l’image contient du contenu orienté adulte et/ou est racé. |
Bounding |
Cadre englobant d’une zone à l’intérieur d’une image. |
Category |
Objet décrivant la catégorie identifiée. |
Category |
Objet décrivant des détails de catégorie supplémentaires. |
Celebrities |
Objet décrivant l’identification possible des célébrités. |
Color |
Objet fournissant des métadonnées supplémentaires décrivant les attributs de couleur. |
Computer |
Erreur de demande d’API. |
Computer |
Code d’erreur. |
Computer |
Réponse d’erreur de l’API. |
Computer |
Détails sur l’erreur de demande d’API. |
Computer |
Code d’erreur. |
Description |
Désactivez les modèles de domaine spécifiés lors de la génération de la description. |
Details |
Chaîne indiquant les détails spécifiques au domaine à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de caractéristiques visuelles valides sont les suivants : Célébrités - identifie les célébrités si elles sont détectées dans l’image, Repères - identifie les repères notables dans l’image. |
Detected |
Une marque détectée dans une image. |
Detected |
Objet détecté dans une image. |
Face |
Objet décrivant un visage identifié dans l’image. |
Face |
Objet décrivant le rectangle de visage. |
Gender |
Sexe possible du visage. |
Image |
Résultat de l’opération AnalyzeImage. |
Image |
Légende d’image, c’est-à-dire une brève description de ce que l’image représente. |
Image |
Collection de balises de contenu, ainsi qu’une liste de légendes triées par niveau de confiance et métadonnées d’image. |
Image |
Métadonnées d’image. |
Image |
Observation d’entité dans l’image, ainsi que le score de confiance. |
Image |
Objet fournissant des types d’images possibles et des niveaux de confiance correspondants. |
Image |
|
Landmarks |
Point de repère reconnu dans l’image. |
Object |
Objet détecté à l’intérieur d’une image. |
Visual |
Chaîne indiquant les types de caractéristiques visuelles à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de fonctionnalités visuelles valides sont les suivants : Catégories : catégorise le contenu d’image en fonction d’une taxonomie définie dans la documentation. Balises : balise l’image avec une liste détaillée de mots liés au contenu de l’image. Description : décrit le contenu de l’image avec une phrase anglaise complète. Visages : détecte si des visages sont présents. S’il est présent, générez des coordonnées, un sexe et un âge. ImageType : détecte si l’image est clipart ou un dessin de trait. Couleur : détermine la couleur d’accentuation, la couleur dominante et si une image est noire&blanc. Adulte - détecte si l’image est pornographique dans la nature (représente nudité ou acte sexuel) ou est gory (représente la violence extrême ou le sang). Le contenu sexuellement suggestif (contenu racé) est également détecté. Objets : détecte différents objets au sein d’une image, y compris l’emplacement approximatif. L’argument Objects est disponible uniquement en anglais. Marques : détecte différentes marques au sein d’une image, y compris l’emplacement approximatif. L’argument Brands est disponible uniquement en anglais. |
AdultInfo
Objet décrivant si l’image contient du contenu orienté adulte et/ou est racé.
Nom | Type | Description |
---|---|---|
adultScore |
number (double) |
Noter de 0 à 1 qui indique la quantité de contenu considérée comme orientée adulte dans l’image. |
goreScore |
number (double) |
Noter de 0 à 1 qui indique la façon dont gory est l’image. |
isAdultContent |
boolean |
Valeur indiquant si l’image contient du contenu orienté adulte. |
isGoryContent |
boolean |
Valeur indiquant si l’image est gory. |
isRacyContent |
boolean |
Valeur indiquant si l’image est racé. |
racyScore |
number (double) |
Noter de 0 à 1 qui indique la façon dont l’image est suggestive. |
BoundingRect
Cadre englobant d’une zone à l’intérieur d’une image.
Nom | Type | Description |
---|---|---|
h |
integer (int32) |
Hauteur mesurée à partir du point supérieur gauche de la zone, en pixels. |
w |
integer (int32) |
Largeur mesurée à partir du point supérieur gauche de la zone, en pixels. |
x |
integer (int32) |
Coordonnée X du point gauche supérieur gauche de la zone, en pixels. |
y |
integer (int32) |
Coordonnée Y du point gauche supérieur gauche de la zone, en pixels. |
Category
Objet décrivant la catégorie identifiée.
Nom | Type | Description |
---|---|---|
detail |
Détails de la catégorie identifiée. |
|
name |
string |
Nom de la catégorie. |
score |
number (double) |
Scoring de la catégorie. |
CategoryDetail
Objet décrivant des détails de catégorie supplémentaires.
Nom | Type | Description |
---|---|---|
celebrities |
Un tableau de célébrités, le cas échéant. |
|
landmarks |
Tableau de repères s’il est identifié. |
CelebritiesModel
Objet décrivant l’identification possible des célébrités.
Nom | Type | Description |
---|---|---|
confidence |
number (double) |
Niveau de confiance pour la reconnaissance des célébrités comme valeur comprise entre 0 et 1. |
faceRectangle |
Emplacement du visage identifié dans l’image. |
|
name |
string |
Nom de la célébrité. |
ColorInfo
Objet fournissant des métadonnées supplémentaires décrivant les attributs de couleur.
Nom | Type | Description |
---|---|---|
accentColor |
string |
Couleur d’accentuation possible. |
dominantColorBackground |
string |
Couleur d’arrière-plan dominante possible. |
dominantColorForeground |
string |
Couleur de premier plan dominante possible. |
dominantColors |
string[] |
Tableau de couleurs dominantes possibles. |
isBWImg |
boolean |
Valeur indiquant si l’image est noire et blanche. |
ComputerVisionError
Erreur de demande d’API.
Nom | Type | Description |
---|---|---|
code |
Code d’erreur. |
|
innererror |
L’erreur interne contient des informations plus spécifiques. |
|
message |
string |
Message expliquant l’erreur signalée par le service. |
ComputerVisionErrorCodes
Code d’erreur.
Valeur | Description |
---|---|
InternalServerError | |
InvalidArgument | |
InvalidRequest | |
ServiceUnavailable |
ComputerVisionErrorResponse
Réponse d’erreur de l’API.
Nom | Type | Description |
---|---|---|
error |
Contenu de l’erreur. |
ComputerVisionInnerError
Détails sur l’erreur de demande d’API.
Nom | Type | Description |
---|---|---|
code |
Code d’erreur. |
|
message |
string |
Message d'erreur. |
ComputerVisionInnerErrorCodeValue
Code d’erreur.
Valeur | Description |
---|---|
BadArgument | |
CancelledRequest | |
DetectFaceError | |
FailedToProcess | |
InternalServerError | |
InvalidDetails | |
InvalidImageFormat | |
InvalidImageSize | |
InvalidImageUrl | |
InvalidModel | |
InvalidThumbnailSize | |
NotSupportedFeature | |
NotSupportedImage | |
NotSupportedLanguage | |
NotSupportedVisualFeature | |
StorageException | |
Timeout | |
Unspecified | |
UnsupportedMediaType |
DescriptionExclude
Désactivez les modèles de domaine spécifiés lors de la génération de la description.
Valeur | Description |
---|---|
Celebrities | |
Landmarks |
Details
Chaîne indiquant les détails spécifiques au domaine à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de caractéristiques visuelles valides sont les suivants : Célébrités - identifie les célébrités si elles sont détectées dans l’image, Repères - identifie les repères notables dans l’image.
Valeur | Description |
---|---|
Celebrities | |
Landmarks |
DetectedBrand
Une marque détectée dans une image.
Nom | Type | Description |
---|---|---|
confidence |
number (double) |
Score de confiance d’avoir observé la marque dans l’image, comme valeur comprise entre 0 et 1. |
name |
string |
Étiquette de la marque. |
rectangle |
Emplacement approximatif de la marque détectée. |
DetectedObject
Objet détecté dans une image.
Nom | Type | Description |
---|---|---|
confidence |
number (double) |
Score de confiance d’avoir observé l’objet dans l’image, sous la forme d’une valeur comprise entre 0 et 1. |
object |
string |
Étiquette de l’objet. |
parent |
Objet parent, du point de vue de la taxonomie. L’objet parent est une forme plus générique de cet objet. Par exemple, un « bulldog » aurait un parent de « chien ». |
|
rectangle |
Emplacement approximatif de l’objet détecté. |
FaceDescription
Objet décrivant un visage identifié dans l’image.
Nom | Type | Description |
---|---|---|
age |
integer (int32) |
Âge possible du visage. |
faceRectangle |
Rectangle dans l’image contenant le visage identifié. |
|
gender |
Sexe possible du visage. |
FaceRectangle
Objet décrivant le rectangle de visage.
Nom | Type | Description |
---|---|---|
height |
integer (int32) |
Hauteur mesurée à partir du point supérieur gauche du visage, en pixels. |
left |
integer (int32) |
Coordonnée X du point supérieur gauche du visage, en pixels. |
top |
integer (int32) |
Coordonnée Y du point gauche supérieur gauche du visage, en pixels. |
width |
integer (int32) |
Largeur mesurée à partir du point supérieur gauche du visage, en pixels. |
Gender
Sexe possible du visage.
Valeur | Description |
---|---|
Female | |
Male |
ImageAnalysis
Résultat de l’opération AnalyzeImage.
Nom | Type | Description |
---|---|---|
adult |
Objet décrivant si l’image contient du contenu orienté adulte et/ou est racé. |
|
brands |
Tableau de marques détectées dans l’image. |
|
categories |
Category[] |
Tableau indiquant les catégories identifiées. |
color |
Objet fournissant des métadonnées supplémentaires décrivant les attributs de couleur. |
|
description |
Collection de balises de contenu, ainsi qu’une liste de légendes triées par niveau de confiance et métadonnées d’image. |
|
faces |
Tableau de visages possibles dans l’image. |
|
imageType |
Objet fournissant des types d’images possibles et des niveaux de confiance correspondants. |
|
metadata |
Métadonnées d’image. |
|
modelVersion |
string pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$ |
Version du modèle IA. |
objects |
Tableau d’objets décrivant ce qui a été détecté dans l’image. |
|
requestId |
string |
ID de la demande d’API REST. |
tags |
Image |
Liste des balises avec niveau de confiance. |
ImageCaption
Légende d’image, c’est-à-dire une brève description de ce que l’image représente.
Nom | Type | Description |
---|---|---|
confidence |
number (double) |
Niveau de confiance du service dans la légende. |
text |
string |
Texte de la légende. |
ImageDescriptionDetails
Collection de balises de contenu, ainsi qu’une liste de légendes triées par niveau de confiance et métadonnées d’image.
Nom | Type | Description |
---|---|---|
captions |
Liste des légendes, triées par niveau de confiance. |
|
tags |
string[] |
Collection de balises d’image. |
ImageMetadata
Métadonnées d’image.
Nom | Type | Description |
---|---|---|
format |
string |
Format d’image. |
height |
integer (int32) |
Hauteur de l’image, en pixels. |
width |
integer (int32) |
Largeur de l’image, en pixels. |
ImageTag
Observation d’entité dans l’image, ainsi que le score de confiance.
Nom | Type | Description |
---|---|---|
confidence |
number (double) |
Niveau de confiance que l’entité a été observée. |
hint |
string |
Indicateur/détails facultatifs pour cette balise. |
name |
string |
Nom de l’entité. |
ImageType
Objet fournissant des types d’images possibles et des niveaux de confiance correspondants.
Nom | Type | Description |
---|---|---|
clipArtType |
integer (int32) |
Niveau de confiance que l’image est une image clipart. |
lineDrawingType |
integer (int32) |
Niveau de confiance indiquant que l’image est un dessin de traits. |
ImageUrl
Nom | Type | Description |
---|---|---|
url |
string |
URL accessible publiquement d’une image. |
LandmarksModel
Point de repère reconnu dans l’image.
Nom | Type | Description |
---|---|---|
confidence |
number (double) |
Niveau de confiance pour la reconnaissance de repère sous forme de valeur comprise entre 0 et 1. |
name |
string |
Nom du point de repère. |
ObjectHierarchy
Objet détecté à l’intérieur d’une image.
Nom | Type | Description |
---|---|---|
confidence |
number (double) |
Score de confiance d’avoir observé l’objet dans l’image, sous la forme d’une valeur comprise entre 0 et 1. |
object |
string |
Étiquette de l’objet. |
parent |
Objet parent, du point de vue de la taxonomie. L’objet parent est une forme plus générique de cet objet. Par exemple, un « bulldog » aurait un parent de « chien ». |
VisualFeatureTypes
Chaîne indiquant les types de caractéristiques visuelles à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de fonctionnalités visuelles valides sont les suivants : Catégories : catégorise le contenu d’image en fonction d’une taxonomie définie dans la documentation. Balises : balise l’image avec une liste détaillée de mots liés au contenu de l’image. Description : décrit le contenu de l’image avec une phrase anglaise complète. Visages : détecte si des visages sont présents. S’il est présent, générez des coordonnées, un sexe et un âge. ImageType : détecte si l’image est clipart ou un dessin de trait. Couleur : détermine la couleur d’accentuation, la couleur dominante et si une image est noire&blanc. Adulte - détecte si l’image est pornographique dans la nature (représente nudité ou acte sexuel) ou est gory (représente la violence extrême ou le sang). Le contenu sexuellement suggestif (contenu racé) est également détecté. Objets : détecte différents objets au sein d’une image, y compris l’emplacement approximatif. L’argument Objects est disponible uniquement en anglais. Marques : détecte différentes marques au sein d’une image, y compris l’emplacement approximatif. L’argument Brands est disponible uniquement en anglais.
Valeur | Description |
---|---|
Adult | |
Brands | |
Categories | |
Color | |
Description | |
Faces | |
ImageType | |
Objects | |
Tags |