Analyze Image - Analyze Image
Essa operação extrai um conjunto avançado de recursos visuais com base no conteúdo da imagem. Há suporte para dois métodos de entrada : (1) Carregar uma imagem ou (2) especificar uma URL de imagem. Em sua solicitação, há um parâmetro opcional para permitir que você escolha quais recursos retornar. Por padrão, as categorias de imagem são retornadas na resposta. Uma resposta bem-sucedida será retornada em JSON. Se a solicitação falhar, a resposta conterá um código de erro e uma mensagem para ajudar a entender o que deu errado.
POST {Endpoint}/vision/v3.1/analyze
POST {Endpoint}/vision/v3.1/analyze?visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}
Parâmetros de URI
Nome | Em | Obrigatório | Tipo | Description |
---|---|---|---|---|
Endpoint
|
path | True |
string |
Pontos de extremidade dos Serviços Cognitivos com suporte. |
description
|
query |
Desative os modelos de domínio especificados ao gerar a descrição. |
||
details
|
query |
Details[] |
Uma cadeia de caracteres que indica quais detalhes específicos do domínio devem ser retornados. Vários valores devem ser separados por vírgulas. Os tipos de recursos visuais válidos incluem: Celebridades - identifica celebridades se detectadas na imagem, Landmarks - identifica pontos de referência notáveis na imagem. |
|
language
|
query |
string |
A linguagem desejada para geração de saída. Se esse parâmetro não for especificado, o valor padrão será "en". Idiomas com suporte:en - inglês, Padrão. es - espanhol, ja - japonês, pt - português, zh - chinês simplificado. |
|
visual
|
query |
Uma cadeia de caracteres que indica quais tipos de recursos visuais devem ser retornados. Vários valores devem ser separados por vírgulas. Os tipos de recursos visuais válidos incluem: Categorias – categoriza o conteúdo da imagem de acordo com uma taxonomia definida na documentação. Marcas – marca a imagem com uma lista detalhada de palavras relacionadas ao conteúdo da imagem. Descrição - descreve o conteúdo da imagem com uma frase em inglês completa. Faces – detecta se os rostos estão presentes. Se encontrar, gera coordenadas, sexo e idade. ImageType - detecta se a imagem é clip-art ou um desenho de linha. Cor – determina a cor de destaque, a cor dominante e se uma imagem é preta&branca. Adulto - detecta se a imagem é pornográfica por natureza (retrata nudez ou um ato sexual) ou é sangrenta (retrata violência extrema ou sangue). Conteúdo sexual (também conhecido como conteúdo picante) também será detectado. Objetos – detecta vários objetos dentro de uma imagem, incluindo o local aproximado. O argumento Objects só está disponível em inglês. Marcas – detecta várias marcas dentro de uma imagem, incluindo a localização aproximada. O argumento Brands só está disponível em inglês. |
Cabeçalho da solicitação
Nome | Obrigatório | Tipo | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Corpo da solicitação
Nome | Obrigatório | Tipo | Description |
---|---|---|---|
url | True |
string |
URL acessível publicamente de uma imagem. |
Respostas
Nome | Tipo | Description |
---|---|---|
200 OK |
A resposta inclui os recursos extraídos no formato JSON. Estas são as definições para tipos de enumeração: ClipartType Non - clipart = 0, ambíguo = 1, normal - clipart = 2, bom - clipart = 3. LineDrawingTypeNon - LineDrawing = 0, LineDrawing = 1. |
|
Other Status Codes |
Resposta de erro. |
Segurança
Ocp-Apim-Subscription-Key
Tipo:
apiKey
Em:
header
Exemplos
Successful AnalyzeImage request
Solicitação de exemplo
POST https://westus.api.cognitive.microsoft.com/vision/v3.1/analyze?visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en
{
"url": "{url}"
}
Resposta de exemplo
{
"categories": [
{
"name": "abstract_",
"score": 0.00390625
},
{
"name": "people_",
"score": 0.83984375,
"detail": {
"celebrities": [
{
"name": "Satya Nadella",
"faceRectangle": {
"left": 597,
"top": 162,
"width": 248,
"height": 248
},
"confidence": 0.999028444
}
]
}
},
{
"name": "building_",
"score": 0.984375,
"detail": {
"landmarks": [
{
"name": "Forbidden City",
"confidence": 0.9829016923904419
}
]
}
}
],
"adult": {
"isAdultContent": false,
"isRacyContent": false,
"isGoryContent": false,
"adultScore": 0.0934349000453949,
"racyScore": 0.06861349195241928,
"goreScore": 0.012872257380997575
},
"tags": [
{
"name": "person",
"confidence": 0.9897908568382263
},
{
"name": "man",
"confidence": 0.9449388980865479
},
{
"name": "outdoor",
"confidence": 0.938492476940155
},
{
"name": "window",
"confidence": 0.8951393961906433
},
{
"name": "pangolin",
"confidence": 0.7250059783791661,
"hint": "mammal"
}
],
"description": {
"tags": [
"person",
"man",
"outdoor",
"window",
"glasses"
],
"captions": [
{
"text": "Satya Nadella sitting on a bench",
"confidence": 0.48293603002174407
}
]
},
"requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
"metadata": {
"width": 1500,
"height": 1000,
"format": "Jpeg"
},
"faces": [
{
"age": 44,
"gender": "Male",
"faceRectangle": {
"left": 593,
"top": 160,
"width": 250,
"height": 250
}
}
],
"color": {
"dominantColorForeground": "Brown",
"dominantColorBackground": "Brown",
"dominantColors": [
"Brown",
"Black"
],
"accentColor": "873B59",
"isBWImg": false
},
"imageType": {
"clipArtType": 0,
"lineDrawingType": 0
},
"objects": [
{
"rectangle": {
"x": 0,
"y": 0,
"w": 50,
"h": 50
},
"object": "tree",
"confidence": 0.9,
"parent": {
"object": "plant",
"confidence": 0.95
}
}
],
"brands": [
{
"name": "Pepsi",
"confidence": 0.857,
"rectangle": {
"x": 489,
"y": 79,
"w": 161,
"h": 177
}
},
{
"name": "Coca-Cola",
"confidence": 0.893,
"rectangle": {
"x": 216,
"y": 55,
"w": 171,
"h": 372
}
}
]
}
Definições
Nome | Description |
---|---|
Adult |
Um objeto que descreve se a imagem contém conteúdo orientado para adultos e/ou é picante. |
Bounding |
Uma caixa delimitadora para uma área dentro de uma imagem. |
Category |
Um objeto que descreve a categoria identificada. |
Category |
Um objeto que descreve detalhes adicionais da categoria. |
Celebrities |
Um objeto que descreve uma possível identificação de celebridades. |
Color |
Um objeto que fornece metadados adicionais que descrevem atributos de cor. |
Computer |
Detalhes sobre o erro de solicitação de API. |
Computer |
O código de erro. |
Description |
Desative os modelos de domínio especificados ao gerar a descrição. |
Details |
Uma cadeia de caracteres que indica quais detalhes específicos do domínio devem ser retornados. Vários valores devem ser separados por vírgulas. Os tipos de recursos visuais válidos incluem: Celebridades - identifica celebridades se detectadas na imagem, Landmarks - identifica pontos de referência notáveis na imagem. |
Detected |
Uma marca detectada em uma imagem. |
Detected |
Um objeto detectado em uma imagem. |
Face |
Um objeto que descreve um rosto identificado na imagem. |
Face |
Um objeto que descreve o retângulo facial. |
Gender |
Possível sexo do rosto. |
Image |
Resultado da operação AnalyzeImage. |
Image |
Uma imagem legenda, ou seja, uma breve descrição do que a imagem descreve. |
Image |
Uma coleção de marcas de conteúdo, juntamente com uma lista de legendas classificadas por nível de confiança e metadados de imagem. |
Image |
Metadados de imagem. |
Image |
Uma observação de entidade na imagem, juntamente com a pontuação de confiança. |
Image |
Um objeto que fornece possíveis tipos de imagem e níveis de confiança correspondentes. |
Image |
|
Landmarks |
Um ponto de referência reconhecido na imagem. |
Object |
Um objeto detectado dentro de uma imagem. |
Visual |
Uma cadeia de caracteres que indica quais tipos de recursos visuais devem ser retornados. Vários valores devem ser separados por vírgulas. Os tipos de recursos visuais válidos incluem: Categorias – categoriza o conteúdo da imagem de acordo com uma taxonomia definida na documentação. Marcas – marca a imagem com uma lista detalhada de palavras relacionadas ao conteúdo da imagem. Descrição - descreve o conteúdo da imagem com uma frase em inglês completa. Faces – detecta se os rostos estão presentes. Se encontrar, gera coordenadas, sexo e idade. ImageType - detecta se a imagem é clip-art ou um desenho de linha. Cor – determina a cor de destaque, a cor dominante e se uma imagem é preta&branca. Adulto - detecta se a imagem é pornográfica por natureza (retrata nudez ou um ato sexual) ou é sangrenta (retrata violência extrema ou sangue). Conteúdo sexual (também conhecido como conteúdo picante) também será detectado. Objetos – detecta vários objetos dentro de uma imagem, incluindo o local aproximado. O argumento Objects só está disponível em inglês. Marcas – detecta várias marcas dentro de uma imagem, incluindo a localização aproximada. O argumento Brands só está disponível em inglês. |
AdultInfo
Um objeto que descreve se a imagem contém conteúdo orientado para adultos e/ou é picante.
Nome | Tipo | Description |
---|---|---|
adultScore |
number |
Pontuação de 0 a 1 que indica quanto o conteúdo é considerado orientado para adultos na imagem. |
goreScore |
number |
Pontuação de 0 a 1 que indica como a imagem é gory. |
isAdultContent |
boolean |
Um valor que indica se a imagem contém conteúdo orientado para adultos. |
isGoryContent |
boolean |
Um valor que indica se a imagem é gory. |
isRacyContent |
boolean |
Um valor que indica se a imagem é picante. |
racyScore |
number |
Pontuação de 0 a 1 que indica o quão sugestiva é a imagem. |
BoundingRect
Uma caixa delimitadora para uma área dentro de uma imagem.
Nome | Tipo | Description |
---|---|---|
h |
integer |
Altura medida do ponto superior esquerdo da área, em pixels. |
w |
integer |
Largura medida do ponto superior esquerdo da área, em pixels. |
x |
integer |
Coordenada X do ponto superior esquerdo da área, em pixels. |
y |
integer |
Coordenada Y do ponto superior esquerdo da área, em pixels. |
Category
Um objeto que descreve a categoria identificada.
Nome | Tipo | Description |
---|---|---|
detail |
Detalhes da categoria identificada. |
|
name |
string |
Nome da categoria. |
score |
number |
Pontuação da categoria. |
CategoryDetail
Um objeto que descreve detalhes adicionais da categoria.
Nome | Tipo | Description |
---|---|---|
celebrities |
Uma matriz de celebridades, se houver identificado. |
|
landmarks |
Uma matriz de pontos de referência, se houver identificado. |
CelebritiesModel
Um objeto que descreve uma possível identificação de celebridades.
Nome | Tipo | Description |
---|---|---|
confidence |
number |
Nível de confiança para o reconhecimento de celebridades como um valor que varia de 0 a 1. |
faceRectangle |
Local do rosto identificado na imagem. |
|
name |
string |
O nome da celebridade. |
ColorInfo
Um objeto que fornece metadados adicionais que descrevem atributos de cor.
Nome | Tipo | Description |
---|---|---|
accentColor |
string |
Cor de ênfase possível. |
dominantColorBackground |
string |
Possível cor de plano de fundo dominante. |
dominantColorForeground |
string |
Possível cor de primeiro plano dominante. |
dominantColors |
string[] |
Uma matriz de cores dominantes possíveis. |
isBWImg |
boolean |
Um valor que indica se a imagem é preta e branca. |
ComputerVisionError
Detalhes sobre o erro de solicitação de API.
Nome | Tipo | Description |
---|---|---|
code |
O código de erro. |
|
message |
string |
Uma mensagem explicando o erro relatado pelo serviço. |
requestId |
string |
Um identificador de solicitação exclusivo. |
ComputerVisionErrorCodes
O código de erro.
Nome | Tipo | Description |
---|---|---|
BadArgument |
string |
|
CancelledRequest |
string |
|
DetectFaceError |
string |
|
FailedToProcess |
string |
|
InternalServerError |
string |
|
InvalidDetails |
string |
|
InvalidImageFormat |
string |
|
InvalidImageSize |
string |
|
InvalidImageUrl |
string |
|
InvalidModel |
string |
|
InvalidThumbnailSize |
string |
|
NotSupportedFeature |
string |
|
NotSupportedImage |
string |
|
NotSupportedLanguage |
string |
|
NotSupportedVisualFeature |
string |
|
StorageException |
string |
|
Timeout |
string |
|
Unspecified |
string |
|
UnsupportedMediaType |
string |
DescriptionExclude
Desative os modelos de domínio especificados ao gerar a descrição.
Nome | Tipo | Description |
---|---|---|
Celebrities |
string |
|
Landmarks |
string |
Details
Uma cadeia de caracteres que indica quais detalhes específicos do domínio devem ser retornados. Vários valores devem ser separados por vírgulas. Os tipos de recursos visuais válidos incluem: Celebridades - identifica celebridades se detectadas na imagem, Landmarks - identifica pontos de referência notáveis na imagem.
Nome | Tipo | Description |
---|---|---|
Celebrities |
string |
|
Landmarks |
string |
DetectedBrand
Uma marca detectada em uma imagem.
Nome | Tipo | Description |
---|---|---|
confidence |
number |
Pontuação de confiança de ter observado a marca na imagem, como um valor que varia de 0 a 1. |
name |
string |
Rótulo para a marca. |
rectangle |
Localização aproximada da marca detectada. |
DetectedObject
Um objeto detectado em uma imagem.
Nome | Tipo | Description |
---|---|---|
confidence |
number |
Pontuação de confiança de ter observado o objeto na imagem, como um valor que varia de 0 a 1. |
object |
string |
Rótulo para o objeto . |
parent |
O objeto pai, de uma perspectiva de taxonomia. O objeto pai é uma forma mais genérica desse objeto. Por exemplo, um "buldogue" teria um pai de "cão". |
|
rectangle |
Localização aproximada do objeto detectado. |
FaceDescription
Um objeto que descreve um rosto identificado na imagem.
Nome | Tipo | Description |
---|---|---|
age |
integer |
Possível idade do rosto. |
faceRectangle |
Retângulo na imagem que contém o rosto identificado. |
|
gender |
Possível sexo do rosto. |
FaceRectangle
Um objeto que descreve o retângulo facial.
Nome | Tipo | Description |
---|---|---|
height |
integer |
Altura medida do ponto superior esquerdo da face, em pixels. |
left |
integer |
Coordenada X do ponto superior esquerdo da face, em pixels. |
top |
integer |
Coordenada Y do ponto superior esquerdo da face, em pixels. |
width |
integer |
Largura medida do ponto superior esquerdo da face, em pixels. |
Gender
Possível sexo do rosto.
Nome | Tipo | Description |
---|---|---|
Female |
string |
|
Male |
string |
ImageAnalysis
Resultado da operação AnalyzeImage.
Nome | Tipo | Description |
---|---|---|
adult |
Um objeto que descreve se a imagem contém conteúdo orientado para adultos e/ou é picante. |
|
brands |
Matriz de marcas detectadas na imagem. |
|
categories |
Category[] |
Uma matriz que indica categorias identificadas. |
color |
Um objeto que fornece metadados adicionais que descrevem atributos de cor. |
|
description |
Uma coleção de marcas de conteúdo, juntamente com uma lista de legendas classificadas por nível de confiança e metadados de imagem. |
|
faces |
Uma matriz de rostos possíveis dentro da imagem. |
|
imageType |
Um objeto que fornece possíveis tipos de imagem e níveis de confiança correspondentes. |
|
metadata |
Metadados de imagem. |
|
objects |
Matriz de objetos que descrevem o que foi detectado na imagem. |
|
requestId |
string |
Id da solicitação da API REST. |
tags |
Image |
Uma lista de marcas com nível de confiança. |
ImageCaption
Uma imagem legenda, ou seja, uma breve descrição do que a imagem descreve.
Nome | Tipo | Description |
---|---|---|
confidence |
number |
O nível de confiança que o serviço tem no legenda. |
text |
string |
O texto do legenda. |
ImageDescriptionDetails
Uma coleção de marcas de conteúdo, juntamente com uma lista de legendas classificadas por nível de confiança e metadados de imagem.
Nome | Tipo | Description |
---|---|---|
captions |
Uma lista de legendas, classificada por nível de confiança. |
|
tags |
string[] |
Uma coleção de marcas de imagem. |
ImageMetadata
Metadados de imagem.
Nome | Tipo | Description |
---|---|---|
format |
string |
Formato de imagem. |
height |
integer |
Altura da imagem, em pixels. |
width |
integer |
Largura da imagem, em pixels. |
ImageTag
Uma observação de entidade na imagem, juntamente com a pontuação de confiança.
Nome | Tipo | Description |
---|---|---|
confidence |
number |
O nível de confiança que a entidade foi observada. |
hint |
string |
Dica/detalhes opcionais para essa marca. |
name |
string |
Nome da entidade. |
ImageType
Um objeto que fornece possíveis tipos de imagem e níveis de confiança correspondentes.
Nome | Tipo | Description |
---|---|---|
clipArtType |
integer |
Nível de confiança de que a imagem é um clip-art. |
lineDrawingType |
integer |
Nível de confiança de que a imagem é um desenho de linha. |
ImageUrl
Nome | Tipo | Description |
---|---|---|
url |
string |
URL acessível publicamente de uma imagem. |
LandmarksModel
Um ponto de referência reconhecido na imagem.
Nome | Tipo | Description |
---|---|---|
confidence |
number |
Nível de confiança para o reconhecimento de ponto de referência como um valor que varia de 0 a 1. |
name |
string |
Nome do ponto de referência. |
ObjectHierarchy
Um objeto detectado dentro de uma imagem.
Nome | Tipo | Description |
---|---|---|
confidence |
number |
Pontuação de confiança de ter observado o objeto na imagem, como um valor que varia de 0 a 1. |
object |
string |
Rótulo para o objeto . |
parent |
O objeto pai, de uma perspectiva de taxonomia. O objeto pai é uma forma mais genérica desse objeto. Por exemplo, um "buldogue" teria um pai de "cão". |
VisualFeatureTypes
Uma cadeia de caracteres que indica quais tipos de recursos visuais devem ser retornados. Vários valores devem ser separados por vírgulas. Os tipos de recursos visuais válidos incluem: Categorias – categoriza o conteúdo da imagem de acordo com uma taxonomia definida na documentação. Marcas – marca a imagem com uma lista detalhada de palavras relacionadas ao conteúdo da imagem. Descrição - descreve o conteúdo da imagem com uma frase em inglês completa. Faces – detecta se os rostos estão presentes. Se encontrar, gera coordenadas, sexo e idade. ImageType - detecta se a imagem é clip-art ou um desenho de linha. Cor – determina a cor de destaque, a cor dominante e se uma imagem é preta&branca. Adulto - detecta se a imagem é pornográfica por natureza (retrata nudez ou um ato sexual) ou é sangrenta (retrata violência extrema ou sangue). Conteúdo sexual (também conhecido como conteúdo picante) também será detectado. Objetos – detecta vários objetos dentro de uma imagem, incluindo o local aproximado. O argumento Objects só está disponível em inglês. Marcas – detecta várias marcas dentro de uma imagem, incluindo a localização aproximada. O argumento Brands só está disponível em inglês.
Nome | Tipo | Description |
---|---|---|
Adult |
string |
|
Brands |
string |
|
Categories |
string |
|
Color |
string |
|
Description |
string |
|
Faces |
string |
|
ImageType |
string |
|
Objects |
string |
|
Tags |
string |