Analyze Image - Analyze Image
Durch diesen Vorgang wird ein umfangreicher Satz von Visualfeatures basierend auf dem Bildinhalt extrahiert. Zwei Eingabemethoden werden unterstützt: (1) Hochladen eines Bilds oder (2) Angeben einer Bild-URL. In Ihrer Anforderung gibt es einen optionalen Parameter, mit dem Sie auswählen können, welche Features zurückgegeben werden sollen. Standardmäßig werden Bildkategorien in der Antwort zurückgegeben. Eine erfolgreiche Antwort wird in JSON zurückgegeben. Wenn die Anforderung fehlgeschlagen ist, enthält die Antwort einen Fehlercode und eine Meldung, um zu verstehen, was falsch gelaufen ist.
POST {Endpoint}/vision/v3.1/analyze
POST {Endpoint}/vision/v3.1/analyze?visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}
URI-Parameter
Name | In | Erforderlich | Typ | Beschreibung |
---|---|---|---|---|
Endpoint
|
path | True |
string |
Unterstützte Cognitive Services-Endpunkte. |
description
|
query |
Deaktivieren Sie die angegebenen Domänenmodelle beim Generieren der Beschreibung. |
||
details
|
query |
Details[] |
Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt werden. Gültige visuelle Featuretypen sind: Prominente – identifiziert Prominente, wenn sie im Bild erkannt werden, Wahrzeichen – identifiziert wichtige Sehenswürdigkeiten im Bild. |
|
language
|
query |
string |
Die gewünschte Sprache für die Ausgabegenerierung. Wenn dieser Parameter nicht angegeben ist, lautet der Standardwert "en". Unterstützte Sprachen:en - Englisch, Standard. es - Spanisch, ja - Japanisch, pt - Portugiesisch, zh - Vereinfachtes Chinesisch. |
|
visual
|
query |
Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt werden. Gültige visuelle Featuretypen umfassen: Kategorien : Kategorisiert Bildinhalte gemäß einer in der Dokumentation definierten Taxonomie. Tags: Markiert das Bild mit einer detaillierten Liste von Wörtern im Zusammenhang mit dem Bildinhalt. Description: Beschreibt den Bildinhalt mit einem vollständigen Satz. Gesichter: Erkennt, ob Gesichter vorhanden sind. Wenn Gesichter vorhanden sind, generiert dieses Merkmal Informationen zu Koordinaten, Geschlecht und Alter. ImageType: Erkennt, ob das Bild eine pixelbasierte Rastergrafik oder eine linienbasierte Vektorgrafik ist. Farbe: Bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsener - erkennt, ob das Bild pornografischer Natur ist (zeigt Nacktheit oder einen Sexualakt) oder ist gory (zeigt extreme Gewalt oder Blut). Zweideutige und freizügige Inhalte werden ebenfalls erkannt. Objekte: Erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken : Erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Brands-Argument ist nur für Englisch verfügbar. |
Anforderungsheader
Name | Erforderlich | Typ | Beschreibung |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Anforderungstext
Name | Erforderlich | Typ | Beschreibung |
---|---|---|---|
url | True |
string |
Öffentlich erreichbare URL eines Bilds. |
Antworten
Name | Typ | Beschreibung |
---|---|---|
200 OK |
Die Antwort enthält die extrahierten Features im JSON-Format. Hier sehen Sie die Definitionen für Enumerationstypen: ClipartType Nicht - clipart = 0, mehrdeutig = 1, normal - clipart = 2, good - clipart = 3. LineDrawingTypeNon – LineDrawing = 0, LineDrawing = 1. |
|
Other Status Codes |
Fehlerantwort. |
Sicherheit
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Beispiele
Successful AnalyzeImage request
Sample Request
POST https://westus.api.cognitive.microsoft.com/vision/v3.1/analyze?visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en
{
"url": "{url}"
}
Sample Response
{
"categories": [
{
"name": "abstract_",
"score": 0.00390625
},
{
"name": "people_",
"score": 0.83984375,
"detail": {
"celebrities": [
{
"name": "Satya Nadella",
"faceRectangle": {
"left": 597,
"top": 162,
"width": 248,
"height": 248
},
"confidence": 0.999028444
}
]
}
},
{
"name": "building_",
"score": 0.984375,
"detail": {
"landmarks": [
{
"name": "Forbidden City",
"confidence": 0.9829016923904419
}
]
}
}
],
"adult": {
"isAdultContent": false,
"isRacyContent": false,
"isGoryContent": false,
"adultScore": 0.0934349000453949,
"racyScore": 0.06861349195241928,
"goreScore": 0.012872257380997575
},
"tags": [
{
"name": "person",
"confidence": 0.9897908568382263
},
{
"name": "man",
"confidence": 0.9449388980865479
},
{
"name": "outdoor",
"confidence": 0.938492476940155
},
{
"name": "window",
"confidence": 0.8951393961906433
},
{
"name": "pangolin",
"confidence": 0.7250059783791661,
"hint": "mammal"
}
],
"description": {
"tags": [
"person",
"man",
"outdoor",
"window",
"glasses"
],
"captions": [
{
"text": "Satya Nadella sitting on a bench",
"confidence": 0.48293603002174407
}
]
},
"requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
"metadata": {
"width": 1500,
"height": 1000,
"format": "Jpeg"
},
"faces": [
{
"age": 44,
"gender": "Male",
"faceRectangle": {
"left": 593,
"top": 160,
"width": 250,
"height": 250
}
}
],
"color": {
"dominantColorForeground": "Brown",
"dominantColorBackground": "Brown",
"dominantColors": [
"Brown",
"Black"
],
"accentColor": "873B59",
"isBWImg": false
},
"imageType": {
"clipArtType": 0,
"lineDrawingType": 0
},
"objects": [
{
"rectangle": {
"x": 0,
"y": 0,
"w": 50,
"h": 50
},
"object": "tree",
"confidence": 0.9,
"parent": {
"object": "plant",
"confidence": 0.95
}
}
],
"brands": [
{
"name": "Pepsi",
"confidence": 0.857,
"rectangle": {
"x": 489,
"y": 79,
"w": 161,
"h": 177
}
},
{
"name": "Coca-Cola",
"confidence": 0.893,
"rectangle": {
"x": 216,
"y": 55,
"w": 171,
"h": 372
}
}
]
}
Definitionen
Name | Beschreibung |
---|---|
Adult |
Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder gleich ist. |
Bounding |
Ein Begrenzungsrahmen für einen Bereich innerhalb eines Bilds. |
Category |
Ein Objekt, das die identifizierte Kategorie beschreibt. |
Category |
Ein Objekt, das zusätzliche Kategoriedetails beschreibt. |
Celebrities |
Ein Objekt, das eine mögliche Prominentenidentifikation beschreibt. |
Color |
Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt. |
Computer |
Details zum API-Anforderungsfehler. |
Computer |
Der Fehlercode. |
Description |
Deaktivieren Sie die angegebenen Domänenmodelle beim Generieren der Beschreibung. |
Details |
Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Prominente - identifiziert Prominente, wenn sie im Bild erkannt werden, Wahrzeichen - identifiziert bemerkenswerte Sehenswürdigkeiten im Bild. |
Detected |
Eine Marke, die in einem Bild erkannt wurde. |
Detected |
Ein in einem Bild erkanntes Objekt. |
Face |
Ein Objekt, das eine im Bild identifizierte Gesichtserkennung beschreibt. |
Face |
Ein Objekt, das das Gesichtsrechteck beschreibt. |
Gender |
Mögliches Geschlecht des Gesichts. |
Image |
Ergebnis des AnalyzeImage-Vorgangs. |
Image |
Ein Bild Untertitel, d.h. eine kurze Beschreibung des Bildes. |
Image |
Eine Sammlung von Inhaltstags zusammen mit einer Liste von Untertiteln, die nach Konfidenzniveau und Bildmetadaten sortiert sind. |
Image |
Bildmetadaten. |
Image |
Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung. |
Image |
Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt. |
Image |
|
Landmarks |
Ein im Bild erkanntes Wahrzeichen. |
Object |
Ein Objekt, das in einem Bild erkannt wurde. |
Visual |
Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Kategorien : Kategorisiert Bildinhalte gemäß einer in der Dokumentation definierten Taxonomie. Tags: Markiert das Bild mit einer detaillierten Liste von Wörtern, die sich auf den Bildinhalt beziehen. Description: Beschreibt den Bildinhalt mit einem vollständigen Satz. Gesichter: Erkennt, ob Gesichter vorhanden sind. Wenn Gesichter vorhanden sind, generiert dieses Merkmal Informationen zu Koordinaten, Geschlecht und Alter. ImageType: Erkennt, ob das Bild eine pixelbasierte Rastergrafik oder eine linienbasierte Vektorgrafik ist. Farbe: Bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsener - erkennt, ob das Bild pornografischer Natur ist (zeigt Nacktheit oder einen Sexualakt), oder ist gory (zeigt extreme Gewalt oder Blut). Zweideutige und freizügige Inhalte werden ebenfalls erkannt. Objekte: Erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken: Erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Brands-Argument ist nur für Englisch verfügbar. |
AdultInfo
Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder gleich ist.
Name | Typ | Beschreibung |
---|---|---|
adultScore |
number |
Bewertung von 0 bis 1, die angibt, wie sehr der Inhalt innerhalb des Bilds als erwachsenenorientiert betrachtet wird. |
goreScore |
number |
Eine Bewertung von 0 bis 1, die angibt, wie das Bild gory ist. |
isAdultContent |
boolean |
Ein Wert, der angibt, ob das Bild inhalte für erwachsene Benutzer enthält. |
isGoryContent |
boolean |
Ein Wert, der angibt, ob das Bild gory ist. |
isRacyContent |
boolean |
Ein Wert, der angibt, ob das Bild gleich ist. |
racyScore |
number |
Bewertung von 0 bis 1, die angibt, wie suggestiv das Bild ist. |
BoundingRect
Ein Begrenzungsrahmen für einen Bereich innerhalb eines Bilds.
Name | Typ | Beschreibung |
---|---|---|
h |
integer |
Gemessene Höhe des linken oberen Punkts des Bereichs, in Pixeln. |
w |
integer |
Gemessene Breite des linken oberen Punkts des Bereichs, in Pixeln. |
x |
integer |
X-Koordinate des oberen linken Punkts des Bereichs in Pixel. |
y |
integer |
Y-Koordinate des oberen linken Punkts des Bereichs in Pixeln. |
Category
Ein Objekt, das die identifizierte Kategorie beschreibt.
Name | Typ | Beschreibung |
---|---|---|
detail |
Details der identifizierten Kategorie. |
|
name |
string |
Name der Kategorie |
score |
number |
Bewertung der Kategorie. |
CategoryDetail
Ein Objekt, das zusätzliche Kategoriedetails beschreibt.
Name | Typ | Beschreibung |
---|---|---|
celebrities |
Eine Reihe von Prominenten, falls vorhanden. |
|
landmarks |
Ein Array von Orientierungspunkten, falls vorhanden. |
CelebritiesModel
Ein Objekt, das eine mögliche Prominentenidentifikation beschreibt.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenzstufe für die Prominentenerkennung als Wert von 0 bis 1. |
faceRectangle |
Position des identifizierten Gesichts im Bild. |
|
name |
string |
Name des Prominenten. |
ColorInfo
Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.
Name | Typ | Beschreibung |
---|---|---|
accentColor |
string |
Mögliche Akzentfarbe. |
dominantColorBackground |
string |
Mögliche dominante Hintergrundfarbe. |
dominantColorForeground |
string |
Mögliche dominante Vordergrundfarbe. |
dominantColors |
string[] |
Ein Array von möglichen dominanten Farben. |
isBWImg |
boolean |
Ein Wert, der angibt, ob das Bild schwarzweiß ist. |
ComputerVisionError
Details zum API-Anforderungsfehler.
Name | Typ | Beschreibung |
---|---|---|
code |
Der Fehlercode. |
|
message |
string |
Eine Meldung, die den vom Dienst gemeldeten Fehler erklärt. |
requestId |
string |
Ein eindeutiger Anforderungsbezeichner. |
ComputerVisionErrorCodes
Der Fehlercode.
Name | Typ | Beschreibung |
---|---|---|
BadArgument |
string |
|
CancelledRequest |
string |
|
DetectFaceError |
string |
|
FailedToProcess |
string |
|
InternalServerError |
string |
|
InvalidDetails |
string |
|
InvalidImageFormat |
string |
|
InvalidImageSize |
string |
|
InvalidImageUrl |
string |
|
InvalidModel |
string |
|
InvalidThumbnailSize |
string |
|
NotSupportedFeature |
string |
|
NotSupportedImage |
string |
|
NotSupportedLanguage |
string |
|
NotSupportedVisualFeature |
string |
|
StorageException |
string |
|
Timeout |
string |
|
Unspecified |
string |
|
UnsupportedMediaType |
string |
DescriptionExclude
Deaktivieren Sie die angegebenen Domänenmodelle beim Generieren der Beschreibung.
Name | Typ | Beschreibung |
---|---|---|
Celebrities |
string |
|
Landmarks |
string |
Details
Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Prominente - identifiziert Prominente, wenn sie im Bild erkannt werden, Wahrzeichen - identifiziert bemerkenswerte Sehenswürdigkeiten im Bild.
Name | Typ | Beschreibung |
---|---|---|
Celebrities |
string |
|
Landmarks |
string |
DetectedBrand
Eine Marke, die in einem Bild erkannt wurde.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenzbewertung der Marke im Bild als Wert zwischen 0 und 1. |
name |
string |
Bezeichnung für die Marke. |
rectangle |
Ungefähre Position der erkannten Marke. |
DetectedObject
Ein in einem Bild erkanntes Objekt.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenzbewertung des Objekts im Bild als Wert zwischen 0 und 1. |
object |
string |
Bezeichnung für das Objekt. |
parent |
Das übergeordnete Objekt aus Taxonomiesicht. Das übergeordnete Objekt ist eine generischere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben. |
|
rectangle |
Ungefähre Position des erkannten Objekts. |
FaceDescription
Ein Objekt, das eine im Bild identifizierte Gesichtserkennung beschreibt.
Name | Typ | Beschreibung |
---|---|---|
age |
integer |
Mögliches Alter des Gesichts. |
faceRectangle |
Rechteck im Bild, das das identifizierte Gesicht enthält. |
|
gender |
Mögliches Geschlecht des Gesichts. |
FaceRectangle
Ein Objekt, das das Gesichtsrechteck beschreibt.
Name | Typ | Beschreibung |
---|---|---|
height |
integer |
Höhe, gemessen vom oberen linken Punkt des Gesichts in Pixel. |
left |
integer |
X-Koordinate des oberen linken Punkts des Gesichts in Pixeln. |
top |
integer |
Y-Koordinate des oberen linken Punkts des Gesichts in Pixel. |
width |
integer |
Breite, gemessen vom linken oberen Punkt des Gesichts in Pixel. |
Gender
Mögliches Geschlecht des Gesichts.
Name | Typ | Beschreibung |
---|---|---|
Female |
string |
|
Male |
string |
ImageAnalysis
Ergebnis des AnalyzeImage-Vorgangs.
Name | Typ | Beschreibung |
---|---|---|
adult |
Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder gleich ist. |
|
brands |
Array von Marken, die im Bild erkannt wurden. |
|
categories |
Category[] |
Ein Array, das identifizierte Kategorien angibt. |
color |
Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt. |
|
description |
Eine Sammlung von Inhaltstags zusammen mit einer Liste von Untertiteln, die nach Konfidenzniveau und Bildmetadaten sortiert sind. |
|
faces |
Ein Array möglicher Gesichter innerhalb des Bilds. |
|
imageType |
Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt. |
|
metadata |
Bildmetadaten. |
|
objects |
Array von Objekten, die beschreiben, was im Bild erkannt wurde. |
|
requestId |
string |
ID der REST-API-Anforderung. |
tags |
Image |
Eine Liste von Tags mit Konfidenzniveau. |
ImageCaption
Ein Bild Untertitel, d.h. eine kurze Beschreibung des Bildes.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Das Maß an Vertrauen, das der Dienst in der Untertitel hat. |
text |
string |
Der Text des Untertitel. |
ImageDescriptionDetails
Eine Sammlung von Inhaltstags zusammen mit einer Liste von Untertiteln, die nach Konfidenzniveau und Bildmetadaten sortiert sind.
Name | Typ | Beschreibung |
---|---|---|
captions |
Eine Liste von Untertiteln, sortiert nach Konfidenzniveau. |
|
tags |
string[] |
Eine Auflistung von Bildtags. |
ImageMetadata
Bildmetadaten.
Name | Typ | Beschreibung |
---|---|---|
format |
string |
Bildformat. |
height |
integer |
Bildhöhe in Pixel. |
width |
integer |
Bildbreite in Pixel. |
ImageTag
Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Das Maß an Vertrauen, das die Entität beobachtet hat. |
hint |
string |
Optionale Hinweise/Details für dieses Tag. |
name |
string |
Name der Entität. |
ImageType
Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.
Name | Typ | Beschreibung |
---|---|---|
clipArtType |
integer |
Konfidenzstufe, dass es sich bei dem Bild um eine Clipart handelt. |
lineDrawingType |
integer |
Konfidenzstufe, dass es sich bei dem Bild um eine Linienzeichnung handelt. |
ImageUrl
Name | Typ | Beschreibung |
---|---|---|
url |
string |
Öffentlich zugängliche URL eines Bilds. |
LandmarksModel
Ein im Bild erkanntes Wahrzeichen.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenzstufe für die Orientierungserkennung als Wert von 0 bis 1. |
name |
string |
Name des Wahrzeichens. |
ObjectHierarchy
Ein Objekt, das in einem Bild erkannt wurde.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number |
Konfidenzwert, der das Objekt im Bild als Wert von 0 bis 1 beobachtet hat. |
object |
string |
Bezeichnung für das Objekt. |
parent |
Das übergeordnete Objekt aus Taxonomiesicht. Das übergeordnete Objekt ist eine allgemeinere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben. |
VisualFeatureTypes
Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Kategorien : Kategorisiert Bildinhalte gemäß einer in der Dokumentation definierten Taxonomie. Tags: Markiert das Bild mit einer detaillierten Liste von Wörtern, die sich auf den Bildinhalt beziehen. Description: Beschreibt den Bildinhalt mit einem vollständigen Satz. Gesichter: Erkennt, ob Gesichter vorhanden sind. Wenn Gesichter vorhanden sind, generiert dieses Merkmal Informationen zu Koordinaten, Geschlecht und Alter. ImageType: Erkennt, ob das Bild eine pixelbasierte Rastergrafik oder eine linienbasierte Vektorgrafik ist. Farbe: Bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsener - erkennt, ob das Bild pornografischer Natur ist (zeigt Nacktheit oder einen Sexualakt), oder ist gory (zeigt extreme Gewalt oder Blut). Zweideutige und freizügige Inhalte werden ebenfalls erkannt. Objekte: Erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken: Erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Brands-Argument ist nur für Englisch verfügbar.
Name | Typ | Beschreibung |
---|---|---|
Adult |
string |
|
Brands |
string |
|
Categories |
string |
|
Color |
string |
|
Description |
string |
|
Faces |
string |
|
ImageType |
string |
|
Objects |
string |
|
Tags |
string |