Image Analysis - Analyze Stream
Analise a imagem de entrada. A solicitação contém fluxo de imagem com qualquer tipo de conteúdo ['image/*', 'application/octet-stream'] ou uma carga JSON que inclui uma propriedade url a ser usada para recuperar o fluxo de imagem.
POST /imageanalysis:analyze?overload=stream&api-version=2023-04-01-preview
POST /imageanalysis:analyze?overload=stream&features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview
Parâmetros de URI
| Nome | Em | Obrigatório | Tipo | Description |
|---|---|---|---|---|
|
api-version
|
query | True |
string |
Versão da API solicitada. |
|
features
|
query |
Os recursos visuais solicitados: marcas, objetos, legenda, denseCaptions, leitura, smartCrops, pessoas. Esse parâmetro precisará ser especificado se o parâmetro "model-name" não for especificado. |
||
|
gender-neutral-caption
|
query |
boolean |
Sinalizador booliano para habilitar legendas neutras de gênero para recursos de legenda e denseCaptions. Se esse parâmetro não for especificado, o valor padrão será "false". |
|
|
language
|
query |
string |
O idioma desejado para a geração de saída. Se esse parâmetro não for especificado, o valor padrão será "en". Consulte https://aka.ms/cv-languages para obter uma lista de idiomas com suporte. |
|
|
model-name
|
query |
string |
O nome do modelo treinado personalizado. Esse parâmetro precisa ser especificado se o parâmetro "features" não for especificado. |
|
|
smartcrops-aspect-ratios
|
query |
string |
Uma lista de proporções a serem usadas para o recurso smartCrops. As taxas de proporção são calculadas dividindo a largura da cultura de destino pela altura. Os valores com suporte estão entre 0,75 e 1,8 (inclusive). Vários valores devem ser separados por vírgula. Se esse parâmetro não for especificado, o serviço retornará uma sugestão de corte com uma taxa de proporção que ele achar adequada entre 0,5 e 2,0 (inclusive). |
Corpo da solicitação
Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"
| Nome | Tipo | Description |
|---|---|---|
| body |
string (byte) |
Um fluxo de imagem. |
Respostas
| Nome | Tipo | Description |
|---|---|---|
| 200 OK |
Êxito |
|
| Other Status Codes |
Erro Cabeçalhos x-ms-error-code: string |
Exemplos
AnalyzeImageFromImageStream_CustomModel
Solicitação de exemplo
POST /imageanalysis:analyze?overload=stream&model-name=my_model_name&api-version=2023-04-01-preview
"Ynl0ZXM="
Resposta de exemplo
{
"modelVersion": "2023-04-01-preview",
"customModelResult": {
"objectsResult": {
"values": [
{
"id": "1",
"boundingBox": {
"x": 197,
"y": 68,
"w": 356,
"h": 394
},
"tags": [
{
"name": "class1",
"confidence": 0.92431640625
}
]
},
{
"id": "2",
"boundingBox": {
"x": 0,
"y": 77,
"w": 241,
"h": 359
},
"tags": [
{
"name": "class1",
"confidence": 0.87890625
}
]
}
]
}
},
"metadata": {
"width": 660,
"height": 495
}
}
Definições
| Nome | Description |
|---|---|
|
Adult |
Um objeto que descreve a correspondência de conteúdo adulto. |
|
Adult |
Um objeto que descreve se a imagem contém conteúdo orientado para adultos e/ou é picante. |
|
Bounding |
Uma caixa delimitadora para uma área dentro de uma imagem. |
|
Caption |
Uma breve descrição do que a imagem ilustra. |
|
Crop |
Uma região identificada para corte inteligente. Haverá uma região retornada para cada proporção solicitada. |
|
Dense |
Uma breve descrição do que a imagem ilustra. |
|
Dense |
Uma lista de legendas. |
|
Detected |
Descreve um objeto detectado em uma imagem. |
|
Detected |
Uma pessoa detectada em uma imagem. |
|
Document |
Um objeto de linha de conteúdo que consiste em uma sequência adjacente de elementos de conteúdo, como palavras e marcas de seleção. |
|
Document |
O conteúdo e os elementos de layout extraídos de uma página da entrada. |
|
Document |
Região contígua da propriedade de conteúdo concatenado, especificada como um deslocamento e comprimento. |
|
Document |
Um objeto que representa os estilos de texto observados. |
|
Document |
Um objeto de palavra que consiste em uma sequência contígua de caracteres. Para idiomas delimitados sem espaço, como chinês, japonês e coreano, cada caractere é representado como sua própria palavra. |
|
Error |
Resposta retornada quando ocorre um erro. |
|
Error |
Informações de erro. |
|
Error |
Erro detalhado. |
|
Image |
Descreva os resultados combinados de diferentes tipos de análise de imagem. |
|
Image |
As informações de metadados da imagem, como altura e largura. |
|
Image |
Descreve o resultado da previsão de uma imagem. |
|
Objects |
Descreve objetos detectados em uma imagem. |
|
People |
Um objeto que descreve se a imagem contém pessoas. |
|
Read |
Os resultados de uma operação de leitura. |
|
Smart |
Resultado do corte inteligente. |
| Tag |
Uma observação de entidade na imagem, juntamente com a pontuação de confiança. |
|
Tags |
Uma lista de marcas com nível de confiança. |
|
Visual |
Os recursos visuais solicitados: marcas, objetos, legenda, denseCaptions, leitura, smartCrops, pessoas. Esse parâmetro precisará ser especificado se o parâmetro "model-name" não for especificado. |
AdultMatch
Um objeto que descreve a correspondência de conteúdo adulto.
| Nome | Tipo | Description |
|---|---|---|
| confidence |
number (double) minimum: 0maximum: 1 |
Um valor que indica o nível de confiança do conteúdo adulto correspondente. |
| isMatch |
boolean |
Um valor que indica se a imagem corresponde ao conteúdo adulto. |
AdultResult
Um objeto que descreve se a imagem contém conteúdo orientado para adultos e/ou é picante.
| Nome | Tipo | Description |
|---|---|---|
| adult |
Um objeto que descreve a correspondência de conteúdo adulto. |
|
| gore |
Um objeto que descreve a correspondência de conteúdo adulto. |
|
| racy |
Um objeto que descreve a correspondência de conteúdo adulto. |
BoundingBox
Uma caixa delimitadora para uma área dentro de uma imagem.
| Nome | Tipo | Description |
|---|---|---|
| h |
integer (int32) minimum: 1 |
Altura medida do ponto superior esquerdo da área, em pixels. |
| w |
integer (int32) minimum: 1 |
Largura medida do ponto superior esquerdo da área, em pixels. |
| x |
integer (int32) minimum: 0 |
Coordenada esquerda do ponto superior esquerdo da área, em pixels. |
| y |
integer (int32) minimum: 0 |
Coordenada superior do ponto superior esquerdo da área, em pixels. |
CaptionResult
Uma breve descrição do que a imagem ilustra.
| Nome | Tipo | Description |
|---|---|---|
| confidence |
number (double) minimum: 0maximum: 1 |
O nível de confiança que o serviço tem na legenda. |
| text |
string minLength: 1 |
O texto da legenda. |
CropRegion
Uma região identificada para corte inteligente. Haverá uma região retornada para cada proporção solicitada.
| Nome | Tipo | Description |
|---|---|---|
| aspectRatio |
number (double) |
A taxa de proporção da região de corte. |
| boundingBox |
Uma caixa delimitadora para uma área dentro de uma imagem. |
DenseCaption
Uma breve descrição do que a imagem ilustra.
| Nome | Tipo | Description |
|---|---|---|
| boundingBox |
Uma caixa delimitadora para uma área dentro de uma imagem. |
|
| confidence |
number (double) minimum: 0maximum: 1 |
O nível de confiança que o serviço tem na legenda. |
| text |
string minLength: 1 |
O texto da legenda. |
DenseCaptionsResult
Uma lista de legendas.
| Nome | Tipo | Description |
|---|---|---|
| values |
Uma lista de legendas. |
DetectedObject
Descreve um objeto detectado em uma imagem.
| Nome | Tipo | Description |
|---|---|---|
| boundingBox |
Uma caixa delimitadora para uma área dentro de uma imagem. |
|
| id |
string minLength: 1 |
ID do objeto detectado. |
| tags |
Tag[] |
Confianças de classificação do objeto detectado. |
DetectedPerson
Uma pessoa detectada em uma imagem.
| Nome | Tipo | Description |
|---|---|---|
| boundingBox |
Uma caixa delimitadora para uma área dentro de uma imagem. |
|
| confidence |
number (double) minimum: 0maximum: 1 |
Pontuação de confiança de ter observado a pessoa na imagem, como um valor que varia de 0 a 1. |
DocumentLine
Um objeto de linha de conteúdo que consiste em uma sequência adjacente de elementos de conteúdo, como palavras e marcas de seleção.
| Nome | Tipo | Description |
|---|---|---|
| boundingBox |
number[] (double) |
Caixa delimitadora da linha. |
| content |
string minLength: 1 |
Conteúdo concatenado dos elementos contidos na ordem de leitura. |
| spans |
Local da linha no conteúdo concatenado da ordem de leitura. |
DocumentPage
O conteúdo e os elementos de layout extraídos de uma página da entrada.
| Nome | Tipo | Description |
|---|---|---|
| angle |
number (double) |
A orientação geral do conteúdo no sentido horário, medida em graus entre (-180, 180]. |
| height |
number (double) |
A altura da imagem/PDF em pixels/polegadas, respectivamente. |
| lines |
Linhas extraídas da página, potencialmente contendo elementos textuais e visuais. |
|
| pageNumber |
integer (int32) |
Número de página baseado em 1 no documento de entrada. |
| spans |
Local da página no conteúdo concatenado da ordem de leitura. |
|
| width |
number (double) |
A largura da imagem/PDF em pixels/polegadas, respectivamente. |
| words |
Palavras extraídas da página. |
DocumentSpan
Região contígua da propriedade de conteúdo concatenado, especificada como um deslocamento e comprimento.
| Nome | Tipo | Description |
|---|---|---|
| length |
integer (int32) |
Número de caracteres no conteúdo representado pelo intervalo. |
| offset |
integer (int32) |
Índice baseado em zero do conteúdo representado pelo intervalo. |
DocumentStyle
Um objeto que representa os estilos de texto observados.
| Nome | Tipo | Description |
|---|---|---|
| confidence |
number (double) |
Confiança de identificar corretamente o estilo. |
| isHandwritten |
boolean |
O conteúdo é manuscrito ou não. |
| spans |
Local dos elementos de texto no conteúdo concatenado ao qual o estilo se aplica. |
DocumentWord
Um objeto de palavra que consiste em uma sequência contígua de caracteres. Para idiomas delimitados sem espaço, como chinês, japonês e coreano, cada caractere é representado como sua própria palavra.
| Nome | Tipo | Description |
|---|---|---|
| boundingBox |
number[] (double) |
Caixa delimitadora da palavra. |
| confidence |
number (double) |
Confiança de extrair corretamente a palavra. |
| content |
string minLength: 1 |
Conteúdo de texto da palavra. |
| span |
Região contígua da propriedade de conteúdo concatenado, especificada como um deslocamento e comprimento. |
ErrorResponse
Resposta retornada quando ocorre um erro.
| Nome | Tipo | Description |
|---|---|---|
| error |
Informações de erro. |
ErrorResponseDetails
Informações de erro.
| Nome | Tipo | Description |
|---|---|---|
| code |
string |
Código de erro. |
| details |
Lista de erros detalhados. |
|
| innererror |
Erro detalhado. |
|
| message |
string |
Mensagem de erro. |
| target |
string |
Destino do erro. |
ErrorResponseInnerError
Erro detalhado.
| Nome | Tipo | Description |
|---|---|---|
| code |
string |
Código de erro. |
| innererror |
Erro detalhado. |
|
| message |
string |
Mensagem de erro. |
ImageAnalysisResult
Descreva os resultados combinados de diferentes tipos de análise de imagem.
| Nome | Tipo | Description |
|---|---|---|
| adultResult |
Um objeto que descreve se a imagem contém conteúdo orientado para adultos e/ou é picante. |
|
| captionResult |
Uma breve descrição do que a imagem ilustra. |
|
| customModelResult |
Descreve o resultado da previsão de uma imagem. |
|
| denseCaptionsResult |
Uma lista de legendas. |
|
| metadata |
As informações de metadados da imagem, como altura e largura. |
|
| modelVersion |
string minLength: 1 |
Versão do modelo. |
| objectsResult |
Descreve objetos detectados em uma imagem. |
|
| peopleResult |
Um objeto que descreve se a imagem contém pessoas. |
|
| readResult |
Os resultados de uma operação de leitura. |
|
| smartCropsResult |
Resultado do corte inteligente. |
|
| tagsResult |
Uma lista de marcas com nível de confiança. |
ImageMetadataApiModel
As informações de metadados da imagem, como altura e largura.
| Nome | Tipo | Description |
|---|---|---|
| height |
integer (int32) minimum: 1 |
A altura da imagem em pixels. |
| width |
integer (int32) minimum: 1 |
A largura da imagem em pixels. |
ImagePredictionResult
Descreve o resultado da previsão de uma imagem.
| Nome | Tipo | Description |
|---|---|---|
| objectsResult |
Descreve objetos detectados em uma imagem. |
|
| tagsResult |
Uma lista de marcas com nível de confiança. |
ObjectsResult
Descreve objetos detectados em uma imagem.
| Nome | Tipo | Description |
|---|---|---|
| values |
Uma matriz de objetos detectados. |
PeopleResult
Um objeto que descreve se a imagem contém pessoas.
| Nome | Tipo | Description |
|---|---|---|
| values |
Uma matriz de pessoas detectadas. |
ReadResult
Os resultados de uma operação de leitura.
| Nome | Tipo | Description |
|---|---|---|
| content |
string minLength: 1 |
Concatenar a representação de cadeia de caracteres de todos os elementos textuais e visuais na ordem de leitura. |
| pages |
Uma lista de páginas analisadas. |
|
| stringIndexType |
string minLength: 1 |
O método usado para calcular o deslocamento e o comprimento da cadeia de caracteres, os valores possíveis incluem: 'textElements', 'unicodeCodePoint', 'utf16CodeUnit' etc. |
| styles |
Estilos de fonte extraídos. |
SmartCropsResult
Resultado do corte inteligente.
| Nome | Tipo | Description |
|---|---|---|
| values |
Regiões recomendadas para cortar a imagem. |
Tag
Uma observação de entidade na imagem, juntamente com a pontuação de confiança.
| Nome | Tipo | Description |
|---|---|---|
| confidence |
number (double) minimum: 0maximum: 1 |
O nível de confiança que a entidade foi observada. |
| name |
string minLength: 1 |
Nome da entidade. |
TagsResult
Uma lista de marcas com nível de confiança.
| Nome | Tipo | Description |
|---|---|---|
| values |
Tag[] |
Uma lista de marcas com nível de confiança. |
VisualFeature
Os recursos visuais solicitados: marcas, objetos, legenda, denseCaptions, leitura, smartCrops, pessoas. Esse parâmetro precisará ser especificado se o parâmetro "model-name" não for especificado.
| Valor | Description |
|---|---|
| tags | |
| caption | |
| denseCaptions | |
| objects | |
| read | |
| smartCrops | |
| people |