Partager via


Analyze Image - Analyze Image

Cette opération extrait un ensemble complet de fonctionnalités visuelles basées sur le contenu de l’image. Deux méthodes d’entrée sont prises en charge : (1) Chargement d’une image ou (2) spécifiant une URL d’image. Dans votre demande, il existe un paramètre facultatif pour vous permettre de choisir les fonctionnalités à retourner. Par défaut, les catégories d’images sont retournées dans la réponse. Une réponse réussie est retournée au format JSON. Si la demande a échoué, la réponse contient un code d’erreur et un message pour vous aider à comprendre ce qui s’est passé.

POST {Endpoint}/vision/v3.2/analyze
POST {Endpoint}/vision/v3.2/analyze?visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}&model-version={model-version}

Paramètres URI

Nom Dans Obligatoire Type Description
Endpoint
path True

string

Points de terminaison Cognitive Services pris en charge.

descriptionExclude
query

DescriptionExclude[]

Désactivez les modèles de domaine spécifiés lors de la génération de la description.

details
query

Details[]

Chaîne indiquant les détails spécifiques au domaine à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de caractéristiques visuelles valides sont les suivants : Célébrités - identifie les célébrités si elles sont détectées dans l’image, Repères - identifie les repères notables dans l’image.

language
query

string

Langage souhaité pour la génération de sortie. Si ce paramètre n’est pas spécifié, la valeur par défaut est « en ». Consultez https://aka.ms/cv-languages pour obtenir la liste des langues prises en charge.

model-version
query

string

pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$

Paramètre facultatif pour spécifier la version du modèle IA. Les valeurs acceptées sont les suivantes : « latest », « 2021-04-01 », « 2021-05-01 ». La valeur par défaut est « latest ».

visualFeatures
query

VisualFeatureTypes[]

Chaîne indiquant les types de caractéristiques visuelles à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de fonctionnalités visuelles valides sont les suivants : Catégories : catégorise le contenu d’image en fonction d’une taxonomie définie dans la documentation. Balises : balise l’image avec une liste détaillée de mots liés au contenu de l’image. Description : décrit le contenu de l’image avec une phrase anglaise complète. Visages : détecte si des visages sont présents. S’il est présent, générez des coordonnées, un sexe et un âge. ImageType : détecte si l’image est clipart ou un dessin de trait. Couleur : détermine la couleur d’accentuation, la couleur dominante et si une image est noire&blanc. Adulte - détecte si l’image est pornographique dans la nature (représente nudité ou acte sexuel) ou est gory (représente la violence extrême ou le sang). Le contenu sexuellement suggestif (contenu racé) est également détecté. Objets : détecte différents objets au sein d’une image, y compris l’emplacement approximatif. L’argument Objects est disponible uniquement en anglais. Marques : détecte différentes marques au sein d’une image, y compris l’emplacement approximatif. L’argument Brands est disponible uniquement en anglais.

En-tête de la demande

Nom Obligatoire Type Description
Ocp-Apim-Subscription-Key True

string

Corps de la demande

Nom Obligatoire Type Description
url True

string

URL accessible publiquement d’une image.

Réponses

Nom Type Description
200 OK

ImageAnalysis

La réponse inclut les fonctionnalités extraites au format JSON. Voici les définitions des types d’énumération :

ClipartType

Non - Clipart = 0, ambigu = 1, normal - clipart = 2, good - clipart = 3. LineDrawingTypeNon - LineDrawing = 0, LineDrawing = 1.

Other Status Codes

ComputerVisionErrorResponse

Réponse d’erreur.

Sécurité

Ocp-Apim-Subscription-Key

Type: apiKey
Dans: header

Exemples

Successful AnalyzeImage request

Exemple de requête

POST https://westus.api.cognitive.microsoft.com/vision/v3.2/analyze?visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en


{
  "url": "{url}"
}

Exemple de réponse

{
  "categories": [
    {
      "name": "abstract_",
      "score": 0.00390625
    },
    {
      "name": "people_",
      "score": 0.83984375,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 597,
              "top": 162,
              "width": 248,
              "height": 248
            },
            "confidence": 0.999028444
          }
        ]
      }
    },
    {
      "name": "building_",
      "score": 0.984375,
      "detail": {
        "landmarks": [
          {
            "name": "Forbidden City",
            "confidence": 0.9829016923904419
          }
        ]
      }
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isRacyContent": false,
    "isGoryContent": false,
    "adultScore": 0.0934349000453949,
    "racyScore": 0.06861349195241928,
    "goreScore": 0.012872257380997575
  },
  "tags": [
    {
      "name": "person",
      "confidence": 0.9897908568382263
    },
    {
      "name": "man",
      "confidence": 0.9449388980865479
    },
    {
      "name": "outdoor",
      "confidence": 0.938492476940155
    },
    {
      "name": "window",
      "confidence": 0.8951393961906433
    },
    {
      "name": "pangolin",
      "confidence": 0.7250059783791661,
      "hint": "mammal"
    }
  ],
  "description": {
    "tags": [
      "person",
      "man",
      "outdoor",
      "window",
      "glasses"
    ],
    "captions": [
      {
        "text": "Satya Nadella sitting on a bench",
        "confidence": 0.48293603002174407
      }
    ]
  },
  "requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
  "metadata": {
    "width": 1500,
    "height": 1000,
    "format": "Jpeg"
  },
  "modelVersion": "2021-04-01",
  "faces": [
    {
      "age": 44,
      "gender": "Male",
      "faceRectangle": {
        "left": 593,
        "top": 160,
        "width": 250,
        "height": 250
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Brown",
    "dominantColorBackground": "Brown",
    "dominantColors": [
      "Brown",
      "Black"
    ],
    "accentColor": "873B59",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "objects": [
    {
      "rectangle": {
        "x": 0,
        "y": 0,
        "w": 50,
        "h": 50
      },
      "object": "tree",
      "confidence": 0.9,
      "parent": {
        "object": "plant",
        "confidence": 0.95
      }
    }
  ],
  "brands": [
    {
      "name": "Pepsi",
      "confidence": 0.857,
      "rectangle": {
        "x": 489,
        "y": 79,
        "w": 161,
        "h": 177
      }
    },
    {
      "name": "Coca-Cola",
      "confidence": 0.893,
      "rectangle": {
        "x": 216,
        "y": 55,
        "w": 171,
        "h": 372
      }
    }
  ]
}

Définitions

Nom Description
AdultInfo

Objet décrivant si l’image contient du contenu orienté adulte et/ou est racé.

BoundingRect

Cadre englobant d’une zone à l’intérieur d’une image.

Category

Objet décrivant la catégorie identifiée.

CategoryDetail

Objet décrivant des détails de catégorie supplémentaires.

CelebritiesModel

Objet décrivant l’identification possible des célébrités.

ColorInfo

Objet fournissant des métadonnées supplémentaires décrivant les attributs de couleur.

ComputerVisionError

Erreur de demande d’API.

ComputerVisionErrorCodes

Code d’erreur.

ComputerVisionErrorResponse

Réponse d’erreur de l’API.

ComputerVisionInnerError

Détails sur l’erreur de demande d’API.

ComputerVisionInnerErrorCodeValue

Code d’erreur.

DescriptionExclude

Désactivez les modèles de domaine spécifiés lors de la génération de la description.

Details

Chaîne indiquant les détails spécifiques au domaine à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de caractéristiques visuelles valides sont les suivants : Célébrités - identifie les célébrités si elles sont détectées dans l’image, Repères - identifie les repères notables dans l’image.

DetectedBrand

Une marque détectée dans une image.

DetectedObject

Objet détecté dans une image.

FaceDescription

Objet décrivant un visage identifié dans l’image.

FaceRectangle

Objet décrivant le rectangle de visage.

Gender

Sexe possible du visage.

ImageAnalysis

Résultat de l’opération AnalyzeImage.

ImageCaption

Légende d’image, c’est-à-dire une brève description de ce que l’image représente.

ImageDescriptionDetails

Collection de balises de contenu, ainsi qu’une liste de légendes triées par niveau de confiance et métadonnées d’image.

ImageMetadata

Métadonnées d’image.

ImageTag

Observation d’entité dans l’image, ainsi que le score de confiance.

ImageType

Objet fournissant des types d’images possibles et des niveaux de confiance correspondants.

ImageUrl
LandmarksModel

Point de repère reconnu dans l’image.

ObjectHierarchy

Objet détecté à l’intérieur d’une image.

VisualFeatureTypes

Chaîne indiquant les types de caractéristiques visuelles à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de fonctionnalités visuelles valides sont les suivants : Catégories : catégorise le contenu d’image en fonction d’une taxonomie définie dans la documentation. Balises : balise l’image avec une liste détaillée de mots liés au contenu de l’image. Description : décrit le contenu de l’image avec une phrase anglaise complète. Visages : détecte si des visages sont présents. S’il est présent, générez des coordonnées, un sexe et un âge. ImageType : détecte si l’image est clipart ou un dessin de trait. Couleur : détermine la couleur d’accentuation, la couleur dominante et si une image est noire&blanc. Adulte - détecte si l’image est pornographique dans la nature (représente nudité ou acte sexuel) ou est gory (représente la violence extrême ou le sang). Le contenu sexuellement suggestif (contenu racé) est également détecté. Objets : détecte différents objets au sein d’une image, y compris l’emplacement approximatif. L’argument Objects est disponible uniquement en anglais. Marques : détecte différentes marques au sein d’une image, y compris l’emplacement approximatif. L’argument Brands est disponible uniquement en anglais.

AdultInfo

Objet décrivant si l’image contient du contenu orienté adulte et/ou est racé.

Nom Type Description
adultScore

number (double)

Noter de 0 à 1 qui indique la quantité de contenu considérée comme orientée adulte dans l’image.

goreScore

number (double)

Noter de 0 à 1 qui indique la façon dont gory est l’image.

isAdultContent

boolean

Valeur indiquant si l’image contient du contenu orienté adulte.

isGoryContent

boolean

Valeur indiquant si l’image est gory.

isRacyContent

boolean

Valeur indiquant si l’image est racé.

racyScore

number (double)

Noter de 0 à 1 qui indique la façon dont l’image est suggestive.

BoundingRect

Cadre englobant d’une zone à l’intérieur d’une image.

Nom Type Description
h

integer (int32)

Hauteur mesurée à partir du point supérieur gauche de la zone, en pixels.

w

integer (int32)

Largeur mesurée à partir du point supérieur gauche de la zone, en pixels.

x

integer (int32)

Coordonnée X du point gauche supérieur gauche de la zone, en pixels.

y

integer (int32)

Coordonnée Y du point gauche supérieur gauche de la zone, en pixels.

Category

Objet décrivant la catégorie identifiée.

Nom Type Description
detail

CategoryDetail

Détails de la catégorie identifiée.

name

string

Nom de la catégorie.

score

number (double)

Scoring de la catégorie.

CategoryDetail

Objet décrivant des détails de catégorie supplémentaires.

Nom Type Description
celebrities

CelebritiesModel[]

Un tableau de célébrités, le cas échéant.

landmarks

LandmarksModel[]

Tableau de repères s’il est identifié.

CelebritiesModel

Objet décrivant l’identification possible des célébrités.

Nom Type Description
confidence

number (double)

Niveau de confiance pour la reconnaissance des célébrités comme valeur comprise entre 0 et 1.

faceRectangle

FaceRectangle

Emplacement du visage identifié dans l’image.

name

string

Nom de la célébrité.

ColorInfo

Objet fournissant des métadonnées supplémentaires décrivant les attributs de couleur.

Nom Type Description
accentColor

string

Couleur d’accentuation possible.

dominantColorBackground

string

Couleur d’arrière-plan dominante possible.

dominantColorForeground

string

Couleur de premier plan dominante possible.

dominantColors

string[]

Tableau de couleurs dominantes possibles.

isBWImg

boolean

Valeur indiquant si l’image est noire et blanche.

ComputerVisionError

Erreur de demande d’API.

Nom Type Description
code

ComputerVisionErrorCodes

Code d’erreur.

innererror

ComputerVisionInnerError

L’erreur interne contient des informations plus spécifiques.

message

string

Message expliquant l’erreur signalée par le service.

ComputerVisionErrorCodes

Code d’erreur.

Valeur Description
InternalServerError
InvalidArgument
InvalidRequest
ServiceUnavailable

ComputerVisionErrorResponse

Réponse d’erreur de l’API.

Nom Type Description
error

ComputerVisionError

Contenu de l’erreur.

ComputerVisionInnerError

Détails sur l’erreur de demande d’API.

Nom Type Description
code

ComputerVisionInnerErrorCodeValue

Code d’erreur.

message

string

Message d'erreur.

ComputerVisionInnerErrorCodeValue

Code d’erreur.

Valeur Description
BadArgument
CancelledRequest
DetectFaceError
FailedToProcess
InternalServerError
InvalidDetails
InvalidImageFormat
InvalidImageSize
InvalidImageUrl
InvalidModel
InvalidThumbnailSize
NotSupportedFeature
NotSupportedImage
NotSupportedLanguage
NotSupportedVisualFeature
StorageException
Timeout
Unspecified
UnsupportedMediaType

DescriptionExclude

Désactivez les modèles de domaine spécifiés lors de la génération de la description.

Valeur Description
Celebrities
Landmarks

Details

Chaîne indiquant les détails spécifiques au domaine à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de caractéristiques visuelles valides sont les suivants : Célébrités - identifie les célébrités si elles sont détectées dans l’image, Repères - identifie les repères notables dans l’image.

Valeur Description
Celebrities
Landmarks

DetectedBrand

Une marque détectée dans une image.

Nom Type Description
confidence

number (double)

Score de confiance d’avoir observé la marque dans l’image, comme valeur comprise entre 0 et 1.

name

string

Étiquette de la marque.

rectangle

BoundingRect

Emplacement approximatif de la marque détectée.

DetectedObject

Objet détecté dans une image.

Nom Type Description
confidence

number (double)

Score de confiance d’avoir observé l’objet dans l’image, sous la forme d’une valeur comprise entre 0 et 1.

object

string

Étiquette de l’objet.

parent

ObjectHierarchy

Objet parent, du point de vue de la taxonomie. L’objet parent est une forme plus générique de cet objet. Par exemple, un « bulldog » aurait un parent de « chien ».

rectangle

BoundingRect

Emplacement approximatif de l’objet détecté.

FaceDescription

Objet décrivant un visage identifié dans l’image.

Nom Type Description
age

integer (int32)

Âge possible du visage.

faceRectangle

FaceRectangle

Rectangle dans l’image contenant le visage identifié.

gender

Gender

Sexe possible du visage.

FaceRectangle

Objet décrivant le rectangle de visage.

Nom Type Description
height

integer (int32)

Hauteur mesurée à partir du point supérieur gauche du visage, en pixels.

left

integer (int32)

Coordonnée X du point supérieur gauche du visage, en pixels.

top

integer (int32)

Coordonnée Y du point gauche supérieur gauche du visage, en pixels.

width

integer (int32)

Largeur mesurée à partir du point supérieur gauche du visage, en pixels.

Gender

Sexe possible du visage.

Valeur Description
Female
Male

ImageAnalysis

Résultat de l’opération AnalyzeImage.

Nom Type Description
adult

AdultInfo

Objet décrivant si l’image contient du contenu orienté adulte et/ou est racé.

brands

DetectedBrand[]

Tableau de marques détectées dans l’image.

categories

Category[]

Tableau indiquant les catégories identifiées.

color

ColorInfo

Objet fournissant des métadonnées supplémentaires décrivant les attributs de couleur.

description

ImageDescriptionDetails

Collection de balises de contenu, ainsi qu’une liste de légendes triées par niveau de confiance et métadonnées d’image.

faces

FaceDescription[]

Tableau de visages possibles dans l’image.

imageType

ImageType

Objet fournissant des types d’images possibles et des niveaux de confiance correspondants.

metadata

ImageMetadata

Métadonnées d’image.

modelVersion

string

pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$

Version du modèle IA.

objects

DetectedObject[]

Tableau d’objets décrivant ce qui a été détecté dans l’image.

requestId

string

ID de la demande d’API REST.

tags

ImageTag[]

Liste des balises avec niveau de confiance.

ImageCaption

Légende d’image, c’est-à-dire une brève description de ce que l’image représente.

Nom Type Description
confidence

number (double)

Niveau de confiance du service dans la légende.

text

string

Texte de la légende.

ImageDescriptionDetails

Collection de balises de contenu, ainsi qu’une liste de légendes triées par niveau de confiance et métadonnées d’image.

Nom Type Description
captions

ImageCaption[]

Liste des légendes, triées par niveau de confiance.

tags

string[]

Collection de balises d’image.

ImageMetadata

Métadonnées d’image.

Nom Type Description
format

string

Format d’image.

height

integer (int32)

Hauteur de l’image, en pixels.

width

integer (int32)

Largeur de l’image, en pixels.

ImageTag

Observation d’entité dans l’image, ainsi que le score de confiance.

Nom Type Description
confidence

number (double)

Niveau de confiance que l’entité a été observée.

hint

string

Indicateur/détails facultatifs pour cette balise.

name

string

Nom de l’entité.

ImageType

Objet fournissant des types d’images possibles et des niveaux de confiance correspondants.

Nom Type Description
clipArtType

integer (int32)

Niveau de confiance que l’image est une image clipart.

lineDrawingType

integer (int32)

Niveau de confiance indiquant que l’image est un dessin de traits.

ImageUrl

Nom Type Description
url

string

URL accessible publiquement d’une image.

LandmarksModel

Point de repère reconnu dans l’image.

Nom Type Description
confidence

number (double)

Niveau de confiance pour la reconnaissance de repère sous forme de valeur comprise entre 0 et 1.

name

string

Nom du point de repère.

ObjectHierarchy

Objet détecté à l’intérieur d’une image.

Nom Type Description
confidence

number (double)

Score de confiance d’avoir observé l’objet dans l’image, sous la forme d’une valeur comprise entre 0 et 1.

object

string

Étiquette de l’objet.

parent

ObjectHierarchy

Objet parent, du point de vue de la taxonomie. L’objet parent est une forme plus générique de cet objet. Par exemple, un « bulldog » aurait un parent de « chien ».

VisualFeatureTypes

Chaîne indiquant les types de caractéristiques visuelles à retourner. Plusieurs valeurs doivent être séparées par des virgules. Les types de fonctionnalités visuelles valides sont les suivants : Catégories : catégorise le contenu d’image en fonction d’une taxonomie définie dans la documentation. Balises : balise l’image avec une liste détaillée de mots liés au contenu de l’image. Description : décrit le contenu de l’image avec une phrase anglaise complète. Visages : détecte si des visages sont présents. S’il est présent, générez des coordonnées, un sexe et un âge. ImageType : détecte si l’image est clipart ou un dessin de trait. Couleur : détermine la couleur d’accentuation, la couleur dominante et si une image est noire&blanc. Adulte - détecte si l’image est pornographique dans la nature (représente nudité ou acte sexuel) ou est gory (représente la violence extrême ou le sang). Le contenu sexuellement suggestif (contenu racé) est également détecté. Objets : détecte différents objets au sein d’une image, y compris l’emplacement approximatif. L’argument Objects est disponible uniquement en anglais. Marques : détecte différentes marques au sein d’une image, y compris l’emplacement approximatif. L’argument Brands est disponible uniquement en anglais.

Valeur Description
Adult
Brands
Categories
Color
Description
Faces
ImageType
Objects
Tags