Analyze Image In Stream - Analyze Image In Stream
Questa operazione estrae un set completo di funzionalità visive basate sul contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL di immagine. All'interno della richiesta è disponibile un parametro facoltativo che consente di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto.
POST {Endpoint}/vision/v3.2/analyze
POST {Endpoint}/vision/v3.2/analyze?overload=stream&visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}&model-version={model-version}
Parametri dell'URI
| Nome | In | Necessario | Tipo | Descrizione |
|---|---|---|---|---|
|
Endpoint
|
path | True |
string |
Endpoint di Servizi cognitivi supportati. |
|
description
|
query |
Disattiva i modelli di dominio specificati durante la generazione della descrizione. |
||
|
details
|
query |
Details[] |
Stringa che indica i dettagli specifici del dominio da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica i punti di riferimento rilevanti nell'immagine. |
|
|
language
|
query |
string |
Lingua desiderata per la generazione di output. Se questo parametro non viene specificato, il valore predefinito è "en". Per un elenco delle lingue supportate, vedere https://aka.ms/cv-languages. |
|
|
model-version
|
query |
string pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$ |
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01", "2021-05-01". Il valore predefinito è "latest". |
|
|
visual
|
query |
Stringa che indica i tipi di funzionalità visivi da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto delle immagini in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione: descrive il contenuto dell'immagine con una frase in inglese completa. Visi: rileva se i visi sono presenti. Se presente, generare coordinate, sesso e età. ImageType: rileva se l'immagine è clipart o un disegno a linee. Colore: determina il colore principale, il colore dominante e se un'immagine è nera&bianco. Adulto - rileva se l'immagine è pornografica in natura (raffigura nudità o atto sessuale) o è gory (raffigura violenza estrema o sangue). Viene rilevato anche contenuto sessualmente allusivo (noto anche come contenuto ghiacciato). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Marchi è disponibile solo in inglese. |
Intestazione della richiesta
Media Types: "application/octet-stream", "multipart/form-data"
| Nome | Necessario | Tipo | Descrizione |
|---|---|---|---|
| Ocp-Apim-Subscription-Key | True |
string |
Corpo della richiesta
Media Types: "application/octet-stream", "multipart/form-data"
| Nome | Tipo | Descrizione |
|---|---|---|
| Image |
object (file) |
Flusso di immagini. |
Risposte
| Nome | Tipo | Descrizione |
|---|---|---|
| 200 OK |
La risposta include le funzionalità estratte in formato JSON. Ecco le definizioni per i tipi di enumerazione: ClipartType Non - clipart = 0, ambiguo = 1, normale - clipart = 2, good - clipart = 3. LineDrawingTypeNon - LineDrawing = 0, LineDrawing = 1. |
|
| Other Status Codes |
Risposta di errore. |
Sicurezza
Ocp-Apim-Subscription-Key
Tipo:
apiKey
In:
header
Esempio
Successful AnalyzeImage request
Esempio di richiesta
POST https://westus.api.cognitive.microsoft.com/vision/v3.2/analyze?overload=stream&visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en
"{binary}"
Risposta di esempio
{
"categories": [
{
"name": "abstract_",
"score": 0.00390625
},
{
"name": "people_",
"score": 0.83984375,
"detail": {
"celebrities": [
{
"name": "Satya Nadella",
"faceRectangle": {
"left": 597,
"top": 162,
"width": 248,
"height": 248
},
"confidence": 0.999028444
}
],
"landmarks": [
{
"name": "Forbidden City",
"confidence": 0.9978346
}
]
}
}
],
"adult": {
"isAdultContent": false,
"isRacyContent": false,
"isGoryContent": false,
"adultScore": 0.0934349000453949,
"racyScore": 0.06861349195241928,
"goreScore": 0.012872257380997575
},
"tags": [
{
"name": "person",
"confidence": 0.9897908568382263
},
{
"name": "man",
"confidence": 0.9449388980865479
},
{
"name": "outdoor",
"confidence": 0.938492476940155
},
{
"name": "window",
"confidence": 0.8951393961906433
},
{
"name": "pangolin",
"confidence": 0.7250059783791661,
"hint": "mammal"
}
],
"description": {
"tags": [
"person",
"man",
"outdoor",
"window",
"glasses"
],
"captions": [
{
"text": "Satya Nadella sitting on a bench",
"confidence": 0.48293603002174407
}
]
},
"requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
"metadata": {
"width": 1500,
"height": 1000,
"format": "Jpeg"
},
"modelVersion": "2021-04-01",
"faces": [
{
"age": 44,
"gender": "Male",
"faceRectangle": {
"left": 593,
"top": 160,
"width": 250,
"height": 250
}
}
],
"color": {
"dominantColorForeground": "Brown",
"dominantColorBackground": "Brown",
"dominantColors": [
"Brown",
"Black"
],
"accentColor": "873B59",
"isBWImg": false
},
"imageType": {
"clipArtType": 0,
"lineDrawingType": 0
},
"objects": [
{
"rectangle": {
"x": 0,
"y": 0,
"w": 50,
"h": 50
},
"object": "tree",
"confidence": 0.9,
"parent": {
"object": "plant",
"confidence": 0.95
}
}
],
"brands": [
{
"name": "Pepsi",
"confidence": 0.857,
"rectangle": {
"x": 489,
"y": 79,
"w": 161,
"h": 177
}
},
{
"name": "Coca-Cola",
"confidence": 0.893,
"rectangle": {
"x": 216,
"y": 55,
"w": 171,
"h": 372
}
}
]
}
Definizioni
| Nome | Descrizione |
|---|---|
|
Adult |
Oggetto che descrive se l'immagine contiene contenuto orientato agli adulti e/o è ghiacciato. |
|
Bounding |
Rettangolo di selezione per un'area all'interno di un'immagine. |
| Category |
Oggetto che descrive la categoria identificata. |
|
Category |
Oggetto che descrive dettagli di categoria aggiuntivi. |
|
Celebrities |
Oggetto che descrive la possibile identificazione delle celebrità. |
|
Color |
Oggetto che fornisce metadati aggiuntivi che descrivono gli attributi di colore. |
|
Computer |
Errore di richiesta API. |
|
Computer |
Codice di errore. |
|
Computer |
Risposta di errore dell'API. |
|
Computer |
Dettagli sull'errore della richiesta API. |
|
Computer |
Codice di errore. |
|
Description |
Disattiva i modelli di dominio specificati durante la generazione della descrizione. |
| Details |
Stringa che indica i dettagli specifici del dominio da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica i punti di riferimento rilevanti nell'immagine. |
|
Detected |
Un marchio rilevato in un'immagine. |
|
Detected |
Oggetto rilevato in un'immagine. |
|
Face |
Oggetto che descrive un viso identificato nell'immagine. |
|
Face |
Oggetto che descrive il rettangolo del viso. |
| Gender |
Possibile sesso del viso. |
|
Image |
Risultato dell'operazione AnalyzeImage. |
|
Image |
Didascalia dell'immagine, ovvero una breve descrizione di ciò che l'immagine rappresenta. |
|
Image |
Raccolta di tag di contenuto, insieme a un elenco di didascalie ordinate in base al livello di attendibilità e ai metadati dell'immagine. |
|
Image |
Metadati dell'immagine. |
|
Image |
Osservazione di entità nell'immagine, insieme al punteggio di attendibilità. |
|
Image |
Oggetto che fornisce possibili tipi di immagine e livelli di confidenza corrispondenti. |
|
Landmarks |
Punto di riferimento riconosciuto nell'immagine. |
|
Object |
Oggetto rilevato all'interno di un'immagine. |
|
Visual |
Stringa che indica i tipi di funzionalità visivi da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto delle immagini in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione: descrive il contenuto dell'immagine con una frase in inglese completa. Visi: rileva se i visi sono presenti. Se presente, generare coordinate, sesso e età. ImageType: rileva se l'immagine è clipart o un disegno a linee. Colore: determina il colore principale, il colore dominante e se un'immagine è nera&bianco. Adulto - rileva se l'immagine è pornografica in natura (raffigura nudità o atto sessuale) o è gory (raffigura violenza estrema o sangue). Viene rilevato anche contenuto sessualmente allusivo (noto anche come contenuto ghiacciato). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Marchi è disponibile solo in inglese. |
AdultInfo
Oggetto che descrive se l'immagine contiene contenuto orientato agli adulti e/o è ghiacciato.
| Nome | Tipo | Descrizione |
|---|---|---|
| adultScore |
number (double) |
Punteggio compreso tra 0 e 1 che indica quanto il contenuto viene considerato orientato agli adulti all'interno dell'immagine. |
| goreScore |
number (double) |
Punteggio compreso tra 0 e 1 che indica come la gory è l'immagine. |
| isAdultContent |
boolean |
Valore che indica se l'immagine contiene contenuto orientato agli adulti. |
| isGoryContent |
boolean |
Valore che indica se l'immagine è gory. |
| isRacyContent |
boolean |
Valore che indica se l'immagine è ghiacciata. |
| racyScore |
number (double) |
Punteggio compreso tra 0 e 1 che indica il modo in cui è l'immagine. |
BoundingRect
Rettangolo di selezione per un'area all'interno di un'immagine.
| Nome | Tipo | Descrizione |
|---|---|---|
| h |
integer (int32) |
Altezza misurata dal punto superiore sinistro dell'area, in pixel. |
| w |
integer (int32) |
Larghezza misurata dal punto superiore sinistro dell'area, in pixel. |
| x |
integer (int32) |
Coordinata X del punto superiore sinistro dell'area, in pixel. |
| y |
integer (int32) |
Coordinata Y del punto superiore sinistro dell'area, in pixel. |
Category
Oggetto che descrive la categoria identificata.
| Nome | Tipo | Descrizione |
|---|---|---|
| detail |
Dettagli della categoria identificata. |
|
| name |
string |
Nome della categoria. |
| score |
number (double) |
Assegnazione dei punteggi alla categoria. |
CategoryDetail
Oggetto che descrive dettagli di categoria aggiuntivi.
| Nome | Tipo | Descrizione |
|---|---|---|
| celebrities |
Matrice di celebrità, se identificate. |
|
| landmarks |
Matrice di punti di riferimento, se identificati. |
CelebritiesModel
Oggetto che descrive la possibile identificazione delle celebrità.
| Nome | Tipo | Descrizione |
|---|---|---|
| confidence |
number (double) |
Livello di confidenza per il riconoscimento delle celebrità come valore compreso tra 0 e 1. |
| faceRectangle |
Posizione del viso identificato nell'immagine. |
|
| name |
string |
Nome della celebrità. |
ColorInfo
Oggetto che fornisce metadati aggiuntivi che descrivono gli attributi di colore.
| Nome | Tipo | Descrizione |
|---|---|---|
| accentColor |
string |
Colore principale possibile. |
| dominantColorBackground |
string |
Possibile colore di sfondo dominante. |
| dominantColorForeground |
string |
Possibile colore di primo piano dominante. |
| dominantColors |
string[] |
Matrice di possibili colori dominanti. |
| isBWImg |
boolean |
Valore che indica se l'immagine è nera e bianca. |
ComputerVisionError
Errore di richiesta API.
| Nome | Tipo | Descrizione |
|---|---|---|
| code |
Codice di errore. |
|
| innererror |
L'errore interno contiene informazioni più specifiche. |
|
| message |
string |
Messaggio che spiega l'errore segnalato dal servizio. |
ComputerVisionErrorCodes
Codice di errore.
| Valore | Descrizione |
|---|---|
| InvalidRequest | |
| InvalidArgument | |
| InternalServerError | |
| ServiceUnavailable |
ComputerVisionErrorResponse
Risposta di errore dell'API.
| Nome | Tipo | Descrizione |
|---|---|---|
| error |
Contenuto dell'errore. |
ComputerVisionInnerError
Dettagli sull'errore della richiesta API.
| Nome | Tipo | Descrizione |
|---|---|---|
| code |
Codice di errore. |
|
| message |
string |
Messaggio di errore. |
ComputerVisionInnerErrorCodeValue
Codice di errore.
| Valore | Descrizione |
|---|---|
| InvalidImageFormat | |
| UnsupportedMediaType | |
| InvalidImageUrl | |
| NotSupportedFeature | |
| NotSupportedImage | |
| Timeout | |
| InternalServerError | |
| InvalidImageSize | |
| BadArgument | |
| DetectFaceError | |
| NotSupportedLanguage | |
| InvalidThumbnailSize | |
| InvalidDetails | |
| InvalidModel | |
| CancelledRequest | |
| NotSupportedVisualFeature | |
| FailedToProcess | |
| Unspecified | |
| StorageException |
DescriptionExclude
Disattiva i modelli di dominio specificati durante la generazione della descrizione.
| Valore | Descrizione |
|---|---|
| Celebrities | |
| Landmarks |
Details
Stringa che indica i dettagli specifici del dominio da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica i punti di riferimento rilevanti nell'immagine.
| Valore | Descrizione |
|---|---|
| Celebrities | |
| Landmarks |
DetectedBrand
Un marchio rilevato in un'immagine.
| Nome | Tipo | Descrizione |
|---|---|---|
| confidence |
number (double) |
Punteggio di attendibilità di aver osservato il marchio nell'immagine, come valore compreso tra 0 e 1. |
| name |
string |
Etichetta per il marchio. |
| rectangle |
Posizione approssimativa del marchio rilevato. |
DetectedObject
Oggetto rilevato in un'immagine.
| Nome | Tipo | Descrizione |
|---|---|---|
| confidence |
number (double) |
Punteggio di confidenza di aver osservato l'oggetto nell'immagine, come valore compreso tra 0 e 1. |
| object |
string |
Etichetta per l'oggetto . |
| parent |
Oggetto padre, dal punto di vista della tassonomia. L'oggetto padre è una forma più generica di questo oggetto. Ad esempio, un 'bulldog' avrebbe un padre di 'cane'. |
|
| rectangle |
Posizione approssimativa dell'oggetto rilevato. |
FaceDescription
Oggetto che descrive un viso identificato nell'immagine.
| Nome | Tipo | Descrizione |
|---|---|---|
| age |
integer (int32) |
Possibile età del viso. |
| faceRectangle |
Rettangolo nell'immagine contenente il viso identificato. |
|
| gender |
Possibile sesso del viso. |
FaceRectangle
Oggetto che descrive il rettangolo del viso.
| Nome | Tipo | Descrizione |
|---|---|---|
| height |
integer (int32) |
Altezza misurata dal punto superiore sinistro del viso, in pixel. |
| left |
integer (int32) |
Coordinata X del punto superiore sinistro del viso, in pixel. |
| top |
integer (int32) |
Coordinata Y del punto superiore sinistro del viso, in pixel. |
| width |
integer (int32) |
Larghezza misurata dal punto superiore sinistro del viso, in pixel. |
Gender
Possibile sesso del viso.
| Valore | Descrizione |
|---|---|
| Male | |
| Female |
ImageAnalysis
Risultato dell'operazione AnalyzeImage.
| Nome | Tipo | Descrizione |
|---|---|---|
| adult |
Oggetto che descrive se l'immagine contiene contenuto orientato agli adulti e/o è ghiacciato. |
|
| brands |
Matrice di marchi rilevati nell'immagine. |
|
| categories |
Category[] |
Matrice che indica le categorie identificate. |
| color |
Oggetto che fornisce metadati aggiuntivi che descrivono gli attributi di colore. |
|
| description |
Raccolta di tag di contenuto, insieme a un elenco di didascalie ordinate in base al livello di attendibilità e ai metadati dell'immagine. |
|
| faces |
Matrice di possibili visi all'interno dell'immagine. |
|
| imageType |
Oggetto che fornisce possibili tipi di immagine e livelli di confidenza corrispondenti. |
|
| metadata |
Metadati dell'immagine. |
|
| modelVersion |
string pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$ |
Versione del modello di intelligenza artificiale. |
| objects |
Matrice di oggetti che descrivono ciò che è stato rilevato nell'immagine. |
|
| requestId |
string |
ID della richiesta dell'API REST. |
| tags |
Image |
Elenco di tag con livello di attendibilità. |
ImageCaption
Didascalia dell'immagine, ovvero una breve descrizione di ciò che l'immagine rappresenta.
| Nome | Tipo | Descrizione |
|---|---|---|
| confidence |
number (double) |
Livello di attendibilità del servizio nella didascalia. |
| text |
string |
Testo della didascalia. |
ImageDescriptionDetails
Raccolta di tag di contenuto, insieme a un elenco di didascalie ordinate in base al livello di attendibilità e ai metadati dell'immagine.
| Nome | Tipo | Descrizione |
|---|---|---|
| captions |
Elenco di didascalie, ordinate in base al livello di attendibilità. |
|
| tags |
string[] |
Raccolta di tag di immagine. |
ImageMetadata
Metadati dell'immagine.
| Nome | Tipo | Descrizione |
|---|---|---|
| format |
string |
Formato immagine. |
| height |
integer (int32) |
Altezza dell'immagine, in pixel. |
| width |
integer (int32) |
Larghezza dell'immagine, in pixel. |
ImageTag
Osservazione di entità nell'immagine, insieme al punteggio di attendibilità.
| Nome | Tipo | Descrizione |
|---|---|---|
| confidence |
number (double) |
Livello di attendibilità che l'entità è stata osservata. |
| hint |
string |
Hint/dettagli facoltativi per questo tag. |
| name |
string |
Nome dell'entità. |
ImageType
Oggetto che fornisce possibili tipi di immagine e livelli di confidenza corrispondenti.
| Nome | Tipo | Descrizione |
|---|---|---|
| clipArtType |
integer (int32) |
Livello di confidenza che l'immagine è una clipart. |
| lineDrawingType |
integer (int32) |
Livello di confidenza che l'immagine è un disegno a linee. |
LandmarksModel
Punto di riferimento riconosciuto nell'immagine.
| Nome | Tipo | Descrizione |
|---|---|---|
| confidence |
number (double) |
Livello di confidenza per il riconoscimento dei punti di riferimento come valore compreso tra 0 e 1. |
| name |
string |
Nome del punto di riferimento. |
ObjectHierarchy
Oggetto rilevato all'interno di un'immagine.
| Nome | Tipo | Descrizione |
|---|---|---|
| confidence |
number (double) |
Punteggio di confidenza di aver osservato l'oggetto nell'immagine, come valore compreso tra 0 e 1. |
| object |
string |
Etichetta per l'oggetto . |
| parent |
Oggetto padre, dal punto di vista della tassonomia. L'oggetto padre è una forma più generica di questo oggetto. Ad esempio, un 'bulldog' avrebbe un padre di 'cane'. |
VisualFeatureTypes
Stringa che indica i tipi di funzionalità visivi da restituire. Più valori devono essere delimitati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto delle immagini in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione: descrive il contenuto dell'immagine con una frase in inglese completa. Visi: rileva se i visi sono presenti. Se presente, generare coordinate, sesso e età. ImageType: rileva se l'immagine è clipart o un disegno a linee. Colore: determina il colore principale, il colore dominante e se un'immagine è nera&bianco. Adulto - rileva se l'immagine è pornografica in natura (raffigura nudità o atto sessuale) o è gory (raffigura violenza estrema o sangue). Viene rilevato anche contenuto sessualmente allusivo (noto anche come contenuto ghiacciato). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Marchi è disponibile solo in inglese.
| Valore | Descrizione |
|---|---|
| ImageType | |
| Faces | |
| Adult | |
| Categories | |
| Color | |
| Tags | |
| Description | |
| Objects | |
| Brands |