Analyze Image In Stream - Analyze Image In Stream

Questa operazione estrae un set completo di funzionalità visive basate sul contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL di immagine. All'interno della richiesta è disponibile un parametro facoltativo che consente di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto.

POST {Endpoint}/vision/v3.2/analyze
POST {Endpoint}/vision/v3.2/analyze?overload=stream&visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}&model-version={model-version}

Parametri dell'URI

Nome In Necessario Tipo Descrizione
Endpoint
path True

string

Endpoint di Servizi cognitivi supportati.

descriptionExclude
query

DescriptionExclude[]

Disattiva i modelli di dominio specificati durante la generazione della descrizione.

details
query

Details[]

Stringa che indica i dettagli specifici del dominio da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica i punti di riferimento rilevanti nell'immagine.

language
query

string

Lingua desiderata per la generazione di output. Se questo parametro non viene specificato, il valore predefinito è "en". Per un elenco delle lingue supportate, vedere https://aka.ms/cv-languages.

model-version
query

string

pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$

Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01", "2021-05-01". Il valore predefinito è "latest".

visualFeatures
query

VisualFeatureTypes[]

Stringa che indica i tipi di funzionalità visivi da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto delle immagini in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione: descrive il contenuto dell'immagine con una frase in inglese completa. Visi: rileva se i visi sono presenti. Se presente, generare coordinate, sesso e età. ImageType: rileva se l'immagine è clipart o un disegno a linee. Colore: determina il colore principale, il colore dominante e se un'immagine è nera&bianco. Adulto - rileva se l'immagine è pornografica in natura (raffigura nudità o atto sessuale) o è gory (raffigura violenza estrema o sangue). Viene rilevato anche contenuto sessualmente allusivo (noto anche come contenuto ghiacciato). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Marchi è disponibile solo in inglese.

Intestazione della richiesta

Media Types: "application/octet-stream", "multipart/form-data"

Nome Necessario Tipo Descrizione
Ocp-Apim-Subscription-Key True

string

Corpo della richiesta

Media Types: "application/octet-stream", "multipart/form-data"

Nome Tipo Descrizione
Image

object (file)

Flusso di immagini.

Risposte

Nome Tipo Descrizione
200 OK

ImageAnalysis

La risposta include le funzionalità estratte in formato JSON. Ecco le definizioni per i tipi di enumerazione:

ClipartType

Non - clipart = 0, ambiguo = 1, normale - clipart = 2, good - clipart = 3. LineDrawingTypeNon - LineDrawing = 0, LineDrawing = 1.

Other Status Codes

ComputerVisionErrorResponse

Risposta di errore.

Sicurezza

Ocp-Apim-Subscription-Key

Tipo: apiKey
In: header

Esempio

Successful AnalyzeImage request

Esempio di richiesta

POST https://westus.api.cognitive.microsoft.com/vision/v3.2/analyze?overload=stream&visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en


"{binary}"

Risposta di esempio

{
  "categories": [
    {
      "name": "abstract_",
      "score": 0.00390625
    },
    {
      "name": "people_",
      "score": 0.83984375,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 597,
              "top": 162,
              "width": 248,
              "height": 248
            },
            "confidence": 0.999028444
          }
        ],
        "landmarks": [
          {
            "name": "Forbidden City",
            "confidence": 0.9978346
          }
        ]
      }
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isRacyContent": false,
    "isGoryContent": false,
    "adultScore": 0.0934349000453949,
    "racyScore": 0.06861349195241928,
    "goreScore": 0.012872257380997575
  },
  "tags": [
    {
      "name": "person",
      "confidence": 0.9897908568382263
    },
    {
      "name": "man",
      "confidence": 0.9449388980865479
    },
    {
      "name": "outdoor",
      "confidence": 0.938492476940155
    },
    {
      "name": "window",
      "confidence": 0.8951393961906433
    },
    {
      "name": "pangolin",
      "confidence": 0.7250059783791661,
      "hint": "mammal"
    }
  ],
  "description": {
    "tags": [
      "person",
      "man",
      "outdoor",
      "window",
      "glasses"
    ],
    "captions": [
      {
        "text": "Satya Nadella sitting on a bench",
        "confidence": 0.48293603002174407
      }
    ]
  },
  "requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
  "metadata": {
    "width": 1500,
    "height": 1000,
    "format": "Jpeg"
  },
  "modelVersion": "2021-04-01",
  "faces": [
    {
      "age": 44,
      "gender": "Male",
      "faceRectangle": {
        "left": 593,
        "top": 160,
        "width": 250,
        "height": 250
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Brown",
    "dominantColorBackground": "Brown",
    "dominantColors": [
      "Brown",
      "Black"
    ],
    "accentColor": "873B59",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "objects": [
    {
      "rectangle": {
        "x": 0,
        "y": 0,
        "w": 50,
        "h": 50
      },
      "object": "tree",
      "confidence": 0.9,
      "parent": {
        "object": "plant",
        "confidence": 0.95
      }
    }
  ],
  "brands": [
    {
      "name": "Pepsi",
      "confidence": 0.857,
      "rectangle": {
        "x": 489,
        "y": 79,
        "w": 161,
        "h": 177
      }
    },
    {
      "name": "Coca-Cola",
      "confidence": 0.893,
      "rectangle": {
        "x": 216,
        "y": 55,
        "w": 171,
        "h": 372
      }
    }
  ]
}

Definizioni

Nome Descrizione
AdultInfo

Oggetto che descrive se l'immagine contiene contenuto orientato agli adulti e/o è ghiacciato.

BoundingRect

Rettangolo di selezione per un'area all'interno di un'immagine.

Category

Oggetto che descrive la categoria identificata.

CategoryDetail

Oggetto che descrive dettagli di categoria aggiuntivi.

CelebritiesModel

Oggetto che descrive la possibile identificazione delle celebrità.

ColorInfo

Oggetto che fornisce metadati aggiuntivi che descrivono gli attributi di colore.

ComputerVisionError

Errore di richiesta API.

ComputerVisionErrorCodes

Codice di errore.

ComputerVisionErrorResponse

Risposta di errore dell'API.

ComputerVisionInnerError

Dettagli sull'errore della richiesta API.

ComputerVisionInnerErrorCodeValue

Codice di errore.

DescriptionExclude

Disattiva i modelli di dominio specificati durante la generazione della descrizione.

Details

Stringa che indica i dettagli specifici del dominio da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica i punti di riferimento rilevanti nell'immagine.

DetectedBrand

Un marchio rilevato in un'immagine.

DetectedObject

Oggetto rilevato in un'immagine.

FaceDescription

Oggetto che descrive un viso identificato nell'immagine.

FaceRectangle

Oggetto che descrive il rettangolo del viso.

Gender

Possibile sesso del viso.

ImageAnalysis

Risultato dell'operazione AnalyzeImage.

ImageCaption

Didascalia dell'immagine, ovvero una breve descrizione di ciò che l'immagine rappresenta.

ImageDescriptionDetails

Raccolta di tag di contenuto, insieme a un elenco di didascalie ordinate in base al livello di attendibilità e ai metadati dell'immagine.

ImageMetadata

Metadati dell'immagine.

ImageTag

Osservazione di entità nell'immagine, insieme al punteggio di attendibilità.

ImageType

Oggetto che fornisce possibili tipi di immagine e livelli di confidenza corrispondenti.

LandmarksModel

Punto di riferimento riconosciuto nell'immagine.

ObjectHierarchy

Oggetto rilevato all'interno di un'immagine.

VisualFeatureTypes

Stringa che indica i tipi di funzionalità visivi da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto delle immagini in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione: descrive il contenuto dell'immagine con una frase in inglese completa. Visi: rileva se i visi sono presenti. Se presente, generare coordinate, sesso e età. ImageType: rileva se l'immagine è clipart o un disegno a linee. Colore: determina il colore principale, il colore dominante e se un'immagine è nera&bianco. Adulto - rileva se l'immagine è pornografica in natura (raffigura nudità o atto sessuale) o è gory (raffigura violenza estrema o sangue). Viene rilevato anche contenuto sessualmente allusivo (noto anche come contenuto ghiacciato). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Marchi è disponibile solo in inglese.

AdultInfo

Oggetto che descrive se l'immagine contiene contenuto orientato agli adulti e/o è ghiacciato.

Nome Tipo Descrizione
adultScore

number (double)

Punteggio compreso tra 0 e 1 che indica quanto il contenuto viene considerato orientato agli adulti all'interno dell'immagine.

goreScore

number (double)

Punteggio compreso tra 0 e 1 che indica come la gory è l'immagine.

isAdultContent

boolean

Valore che indica se l'immagine contiene contenuto orientato agli adulti.

isGoryContent

boolean

Valore che indica se l'immagine è gory.

isRacyContent

boolean

Valore che indica se l'immagine è ghiacciata.

racyScore

number (double)

Punteggio compreso tra 0 e 1 che indica il modo in cui è l'immagine.

BoundingRect

Rettangolo di selezione per un'area all'interno di un'immagine.

Nome Tipo Descrizione
h

integer (int32)

Altezza misurata dal punto superiore sinistro dell'area, in pixel.

w

integer (int32)

Larghezza misurata dal punto superiore sinistro dell'area, in pixel.

x

integer (int32)

Coordinata X del punto superiore sinistro dell'area, in pixel.

y

integer (int32)

Coordinata Y del punto superiore sinistro dell'area, in pixel.

Category

Oggetto che descrive la categoria identificata.

Nome Tipo Descrizione
detail

CategoryDetail

Dettagli della categoria identificata.

name

string

Nome della categoria.

score

number (double)

Assegnazione dei punteggi alla categoria.

CategoryDetail

Oggetto che descrive dettagli di categoria aggiuntivi.

Nome Tipo Descrizione
celebrities

CelebritiesModel[]

Matrice di celebrità, se identificate.

landmarks

LandmarksModel[]

Matrice di punti di riferimento, se identificati.

CelebritiesModel

Oggetto che descrive la possibile identificazione delle celebrità.

Nome Tipo Descrizione
confidence

number (double)

Livello di confidenza per il riconoscimento delle celebrità come valore compreso tra 0 e 1.

faceRectangle

FaceRectangle

Posizione del viso identificato nell'immagine.

name

string

Nome della celebrità.

ColorInfo

Oggetto che fornisce metadati aggiuntivi che descrivono gli attributi di colore.

Nome Tipo Descrizione
accentColor

string

Colore principale possibile.

dominantColorBackground

string

Possibile colore di sfondo dominante.

dominantColorForeground

string

Possibile colore di primo piano dominante.

dominantColors

string[]

Matrice di possibili colori dominanti.

isBWImg

boolean

Valore che indica se l'immagine è nera e bianca.

ComputerVisionError

Errore di richiesta API.

Nome Tipo Descrizione
code

ComputerVisionErrorCodes

Codice di errore.

innererror

ComputerVisionInnerError

L'errore interno contiene informazioni più specifiche.

message

string

Messaggio che spiega l'errore segnalato dal servizio.

ComputerVisionErrorCodes

Codice di errore.

Valore Descrizione
InvalidRequest
InvalidArgument
InternalServerError
ServiceUnavailable

ComputerVisionErrorResponse

Risposta di errore dell'API.

Nome Tipo Descrizione
error

ComputerVisionError

Contenuto dell'errore.

ComputerVisionInnerError

Dettagli sull'errore della richiesta API.

Nome Tipo Descrizione
code

ComputerVisionInnerErrorCodeValue

Codice di errore.

message

string

Messaggio di errore.

ComputerVisionInnerErrorCodeValue

Codice di errore.

Valore Descrizione
InvalidImageFormat
UnsupportedMediaType
InvalidImageUrl
NotSupportedFeature
NotSupportedImage
Timeout
InternalServerError
InvalidImageSize
BadArgument
DetectFaceError
NotSupportedLanguage
InvalidThumbnailSize
InvalidDetails
InvalidModel
CancelledRequest
NotSupportedVisualFeature
FailedToProcess
Unspecified
StorageException

DescriptionExclude

Disattiva i modelli di dominio specificati durante la generazione della descrizione.

Valore Descrizione
Celebrities
Landmarks

Details

Stringa che indica i dettagli specifici del dominio da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica i punti di riferimento rilevanti nell'immagine.

Valore Descrizione
Celebrities
Landmarks

DetectedBrand

Un marchio rilevato in un'immagine.

Nome Tipo Descrizione
confidence

number (double)

Punteggio di attendibilità di aver osservato il marchio nell'immagine, come valore compreso tra 0 e 1.

name

string

Etichetta per il marchio.

rectangle

BoundingRect

Posizione approssimativa del marchio rilevato.

DetectedObject

Oggetto rilevato in un'immagine.

Nome Tipo Descrizione
confidence

number (double)

Punteggio di confidenza di aver osservato l'oggetto nell'immagine, come valore compreso tra 0 e 1.

object

string

Etichetta per l'oggetto .

parent

ObjectHierarchy

Oggetto padre, dal punto di vista della tassonomia. L'oggetto padre è una forma più generica di questo oggetto. Ad esempio, un 'bulldog' avrebbe un padre di 'cane'.

rectangle

BoundingRect

Posizione approssimativa dell'oggetto rilevato.

FaceDescription

Oggetto che descrive un viso identificato nell'immagine.

Nome Tipo Descrizione
age

integer (int32)

Possibile età del viso.

faceRectangle

FaceRectangle

Rettangolo nell'immagine contenente il viso identificato.

gender

Gender

Possibile sesso del viso.

FaceRectangle

Oggetto che descrive il rettangolo del viso.

Nome Tipo Descrizione
height

integer (int32)

Altezza misurata dal punto superiore sinistro del viso, in pixel.

left

integer (int32)

Coordinata X del punto superiore sinistro del viso, in pixel.

top

integer (int32)

Coordinata Y del punto superiore sinistro del viso, in pixel.

width

integer (int32)

Larghezza misurata dal punto superiore sinistro del viso, in pixel.

Gender

Possibile sesso del viso.

Valore Descrizione
Male
Female

ImageAnalysis

Risultato dell'operazione AnalyzeImage.

Nome Tipo Descrizione
adult

AdultInfo

Oggetto che descrive se l'immagine contiene contenuto orientato agli adulti e/o è ghiacciato.

brands

DetectedBrand[]

Matrice di marchi rilevati nell'immagine.

categories

Category[]

Matrice che indica le categorie identificate.

color

ColorInfo

Oggetto che fornisce metadati aggiuntivi che descrivono gli attributi di colore.

description

ImageDescriptionDetails

Raccolta di tag di contenuto, insieme a un elenco di didascalie ordinate in base al livello di attendibilità e ai metadati dell'immagine.

faces

FaceDescription[]

Matrice di possibili visi all'interno dell'immagine.

imageType

ImageType

Oggetto che fornisce possibili tipi di immagine e livelli di confidenza corrispondenti.

metadata

ImageMetadata

Metadati dell'immagine.

modelVersion

string

pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$

Versione del modello di intelligenza artificiale.

objects

DetectedObject[]

Matrice di oggetti che descrivono ciò che è stato rilevato nell'immagine.

requestId

string

ID della richiesta dell'API REST.

tags

ImageTag[]

Elenco di tag con livello di attendibilità.

ImageCaption

Didascalia dell'immagine, ovvero una breve descrizione di ciò che l'immagine rappresenta.

Nome Tipo Descrizione
confidence

number (double)

Livello di attendibilità del servizio nella didascalia.

text

string

Testo della didascalia.

ImageDescriptionDetails

Raccolta di tag di contenuto, insieme a un elenco di didascalie ordinate in base al livello di attendibilità e ai metadati dell'immagine.

Nome Tipo Descrizione
captions

ImageCaption[]

Elenco di didascalie, ordinate in base al livello di attendibilità.

tags

string[]

Raccolta di tag di immagine.

ImageMetadata

Metadati dell'immagine.

Nome Tipo Descrizione
format

string

Formato immagine.

height

integer (int32)

Altezza dell'immagine, in pixel.

width

integer (int32)

Larghezza dell'immagine, in pixel.

ImageTag

Osservazione di entità nell'immagine, insieme al punteggio di attendibilità.

Nome Tipo Descrizione
confidence

number (double)

Livello di attendibilità che l'entità è stata osservata.

hint

string

Hint/dettagli facoltativi per questo tag.

name

string

Nome dell'entità.

ImageType

Oggetto che fornisce possibili tipi di immagine e livelli di confidenza corrispondenti.

Nome Tipo Descrizione
clipArtType

integer (int32)

Livello di confidenza che l'immagine è una clipart.

lineDrawingType

integer (int32)

Livello di confidenza che l'immagine è un disegno a linee.

LandmarksModel

Punto di riferimento riconosciuto nell'immagine.

Nome Tipo Descrizione
confidence

number (double)

Livello di confidenza per il riconoscimento dei punti di riferimento come valore compreso tra 0 e 1.

name

string

Nome del punto di riferimento.

ObjectHierarchy

Oggetto rilevato all'interno di un'immagine.

Nome Tipo Descrizione
confidence

number (double)

Punteggio di confidenza di aver osservato l'oggetto nell'immagine, come valore compreso tra 0 e 1.

object

string

Etichetta per l'oggetto .

parent

ObjectHierarchy

Oggetto padre, dal punto di vista della tassonomia. L'oggetto padre è una forma più generica di questo oggetto. Ad esempio, un 'bulldog' avrebbe un padre di 'cane'.

VisualFeatureTypes

Stringa che indica i tipi di funzionalità visivi da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto delle immagini in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione: descrive il contenuto dell'immagine con una frase in inglese completa. Visi: rileva se i visi sono presenti. Se presente, generare coordinate, sesso e età. ImageType: rileva se l'immagine è clipart o un disegno a linee. Colore: determina il colore principale, il colore dominante e se un'immagine è nera&bianco. Adulto - rileva se l'immagine è pornografica in natura (raffigura nudità o atto sessuale) o è gory (raffigura violenza estrema o sangue). Viene rilevato anche contenuto sessualmente allusivo (noto anche come contenuto ghiacciato). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Marchi è disponibile solo in inglese.

Valore Descrizione
ImageType
Faces
Adult
Categories
Color
Tags
Description
Objects
Brands