Analyze Image In Stream - Analyze Image In Stream
Dieser Vorgang extrahiert einen umfassenden Satz visueller Features basierend auf dem Bildinhalt. Zwei Eingabemethoden werden unterstützt : (1) Hochladen eines Bilds oder (2) Angeben einer Bild-URL. Innerhalb Ihrer Anforderung gibt es einen optionalen Parameter, mit dem Sie auswählen können, welche Features zurückgegeben werden sollen. Standardmäßig werden Bildkategorien in der Antwort zurückgegeben. Eine erfolgreiche Antwort wird in JSON zurückgegeben. Wenn die Anforderung fehlgeschlagen ist, enthält die Antwort einen Fehlercode und eine Meldung, um zu verstehen, was nicht geklappt hat.
POST {Endpoint}/vision/v3.2/analyze
POST {Endpoint}/vision/v3.2/analyze?overload=stream&visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}&model-version={model-version}
URI-Parameter
Name | In | Erforderlich | Typ | Beschreibung |
---|---|---|---|---|
Endpoint
|
path | True |
string |
Unterstützte Cognitive Services-Endpunkte. |
description
|
query |
Deaktivieren Sie beim Generieren der Beschreibung angegebene Domänenmodelle. |
||
details
|
query |
Details[] |
Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Prominente - identifiziert Prominente, wenn in dem Bild erkannt, Landmarks - identifiziert wichtige Sehenswürdigkeiten im Bild. |
|
language
|
query |
string |
Die gewünschte Sprache für die Ausgabegenerierung. Wenn dieser Parameter nicht angegeben ist, lautet der Standardwert "en". Eine Liste der unterstützten Sprachen finden Sie unter https://aka.ms/cv-languages. |
|
model-version
|
query |
string pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$ |
Optionaler Parameter zum Angeben der Version des KI-Modells. Akzeptierte Werte sind: "latest", "2021-04-01", "2021-05-01". Der Standardwert ist "latest". |
|
visual
|
query |
Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Kategorien – kategorisiert Bildinhalte gemäß einer taxonomie, die in der Dokumentation definiert ist. Tags – markiert das Bild mit einer detaillierten Liste von Wörtern im Zusammenhang mit dem Bildinhalt. Beschreibung : Beschreibt den Bildinhalt mit einem vollständigen englischen Satz. Gesichter – erkennt, ob Gesichter vorhanden sind. Wenn vorhanden, generieren Sie Koordinaten, Geschlecht und Alter. ImageType – erkennt, ob das Bild ClipArt oder eine Linienzeichnung ist. Farbe – bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsene - erkennt, ob das Bild pornografische Natur ist (stellt Nacktheit oder sexakt dar), oder ist Gory (zeigt extreme Gewalt oder Blut). Sexuelle suggestive Inhalte (auch bekannt als rassige Inhalte) werden ebenfalls erkannt. Objekte – erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken - erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Argument Marken ist nur in Englisch verfügbar. |
Anforderungsheader
Media Types: "application/octet-stream", "multipart/form-data"
Name | Erforderlich | Typ | Beschreibung |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Anforderungstext
Media Types: "application/octet-stream", "multipart/form-data"
Name | Typ | Beschreibung |
---|---|---|
Image |
object (file) |
Ein Bildstream. |
Antworten
Name | Typ | Beschreibung |
---|---|---|
200 OK |
Die Antwort enthält die extrahierten Features im JSON-Format. Hier sind die Definitionen für Enumerationstypen: ClipartType Non - clipart = 0, mehrdeutig = 1, normal - clipart = 2, good - clipart = 3. LineDrawingTypeNon - LineDrawing = 0, LineDrawing = 1. |
|
Other Status Codes |
Fehlerantwort. |
Sicherheit
Ocp-Apim-Subscription-Key
Typ:
apiKey
In:
header
Beispiele
Successful AnalyzeImage request
Beispielanforderung
POST https://westus.api.cognitive.microsoft.com/vision/v3.2/analyze?overload=stream&visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en
"{binary}"
Beispiel für eine Antwort
{
"categories": [
{
"name": "abstract_",
"score": 0.00390625
},
{
"name": "people_",
"score": 0.83984375,
"detail": {
"celebrities": [
{
"name": "Satya Nadella",
"faceRectangle": {
"left": 597,
"top": 162,
"width": 248,
"height": 248
},
"confidence": 0.999028444
}
],
"landmarks": [
{
"name": "Forbidden City",
"confidence": 0.9978346
}
]
}
}
],
"adult": {
"isAdultContent": false,
"isRacyContent": false,
"isGoryContent": false,
"adultScore": 0.0934349000453949,
"racyScore": 0.06861349195241928,
"goreScore": 0.012872257380997575
},
"tags": [
{
"name": "person",
"confidence": 0.9897908568382263
},
{
"name": "man",
"confidence": 0.9449388980865479
},
{
"name": "outdoor",
"confidence": 0.938492476940155
},
{
"name": "window",
"confidence": 0.8951393961906433
},
{
"name": "pangolin",
"confidence": 0.7250059783791661,
"hint": "mammal"
}
],
"description": {
"tags": [
"person",
"man",
"outdoor",
"window",
"glasses"
],
"captions": [
{
"text": "Satya Nadella sitting on a bench",
"confidence": 0.48293603002174407
}
]
},
"requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
"metadata": {
"width": 1500,
"height": 1000,
"format": "Jpeg"
},
"modelVersion": "2021-04-01",
"faces": [
{
"age": 44,
"gender": "Male",
"faceRectangle": {
"left": 593,
"top": 160,
"width": 250,
"height": 250
}
}
],
"color": {
"dominantColorForeground": "Brown",
"dominantColorBackground": "Brown",
"dominantColors": [
"Brown",
"Black"
],
"accentColor": "873B59",
"isBWImg": false
},
"imageType": {
"clipArtType": 0,
"lineDrawingType": 0
},
"objects": [
{
"rectangle": {
"x": 0,
"y": 0,
"w": 50,
"h": 50
},
"object": "tree",
"confidence": 0.9,
"parent": {
"object": "plant",
"confidence": 0.95
}
}
],
"brands": [
{
"name": "Pepsi",
"confidence": 0.857,
"rectangle": {
"x": 489,
"y": 79,
"w": 161,
"h": 177
}
},
{
"name": "Coca-Cola",
"confidence": 0.893,
"rectangle": {
"x": 216,
"y": 55,
"w": 171,
"h": 372
}
}
]
}
Definitionen
Name | Beschreibung |
---|---|
Adult |
Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder rassig ist. |
Bounding |
Ein umgebendes Feld für einen Bereich innerhalb eines Bilds. |
Category |
Ein Objekt, das die identifizierte Kategorie beschreibt. |
Category |
Ein Objekt, das zusätzliche Kategoriedetails beschreibt. |
Celebrities |
Ein Objekt, das mögliche Prominentenidentifikation beschreibt. |
Color |
Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt. |
Computer |
Der API-Anforderungsfehler. |
Computer |
Der Fehlercode. |
Computer |
Die API-Fehlerantwort. |
Computer |
Details zum API-Anforderungsfehler. |
Computer |
Der Fehlercode. |
Description |
Deaktivieren Sie beim Generieren der Beschreibung angegebene Domänenmodelle. |
Details |
Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Prominente - identifiziert Prominente, wenn in dem Bild erkannt, Landmarks - identifiziert wichtige Sehenswürdigkeiten im Bild. |
Detected |
Eine Marke, die in einem Bild erkannt wurde. |
Detected |
Ein Objekt, das in einem Bild erkannt wurde. |
Face |
Ein Objekt, das ein im Bild identifiziertes Gesicht beschreibt. |
Face |
Ein Objekt, das das Gesichtsrechteck beschreibt. |
Gender |
Mögliches Geschlecht des Gesichtes. |
Image |
Ergebnis des AnalyzeImage-Vorgangs. |
Image |
Eine Bildbeschriftung, d. h. eine kurze Beschreibung der Darstellung des Bilds. |
Image |
Eine Sammlung von Inhaltstags sowie eine Liste der Beschriftungen, sortiert nach Konfidenzniveau und Bildmetadaten. |
Image |
Bildmetadaten. |
Image |
Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung. |
Image |
Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt. |
Landmarks |
Ein Wahrzeichen, das im Bild erkannt wird. |
Object |
Ein Objekt, das in einem Bild erkannt wurde. |
Visual |
Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Kategorien – kategorisiert Bildinhalte gemäß einer taxonomie, die in der Dokumentation definiert ist. Tags – markiert das Bild mit einer detaillierten Liste von Wörtern im Zusammenhang mit dem Bildinhalt. Beschreibung : Beschreibt den Bildinhalt mit einem vollständigen englischen Satz. Gesichter – erkennt, ob Gesichter vorhanden sind. Wenn vorhanden, generieren Sie Koordinaten, Geschlecht und Alter. ImageType – erkennt, ob das Bild ClipArt oder eine Linienzeichnung ist. Farbe – bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsene - erkennt, ob das Bild pornografische Natur ist (stellt Nacktheit oder sexakt dar), oder ist Gory (zeigt extreme Gewalt oder Blut). Sexuelle suggestive Inhalte (auch bekannt als rassige Inhalte) werden ebenfalls erkannt. Objekte – erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken - erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Argument Marken ist nur in Englisch verfügbar. |
AdultInfo
Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder rassig ist.
Name | Typ | Beschreibung |
---|---|---|
adultScore |
number (double) |
Bewertung von 0 bis 1, die angibt, wie viel der Inhalt als erwachsener Innerhalb des Bilds betrachtet wird. |
goreScore |
number (double) |
Bewertung von 0 bis 1, die angibt, wie Gory das Bild ist. |
isAdultContent |
boolean |
Ein Wert, der angibt, ob das Bild erwachsene Inhalte enthält. |
isGoryContent |
boolean |
Ein Wert, der angibt, ob das Bild gory ist. |
isRacyContent |
boolean |
Ein Wert, der angibt, ob das Bild racy ist. |
racyScore |
number (double) |
Bewertung von 0 bis 1, die angibt, wie suggestiv das Bild ist. |
BoundingRect
Ein umgebendes Feld für einen Bereich innerhalb eines Bilds.
Name | Typ | Beschreibung |
---|---|---|
h |
integer (int32) |
Höhe gemessen vom linken oberen Punkt des Bereichs in Pixel. |
w |
integer (int32) |
Breite gemessen vom oberen linken Punkt des Bereichs in Pixel. |
x |
integer (int32) |
X-Koordinate des oberen linken Punkts des Bereichs in Pixel. |
y |
integer (int32) |
Y-Koordinate des oberen linken Punkts des Bereichs in Pixel. |
Category
Ein Objekt, das die identifizierte Kategorie beschreibt.
Name | Typ | Beschreibung |
---|---|---|
detail |
Details der identifizierten Kategorie. |
|
name |
string |
Name der Kategorie. |
score |
number (double) |
Bewertung der Kategorie. |
CategoryDetail
Ein Objekt, das zusätzliche Kategoriedetails beschreibt.
Name | Typ | Beschreibung |
---|---|---|
celebrities |
Eine Reihe von Prominenten, wenn vorhanden. |
|
landmarks |
Ein Array von Sehenswürdigkeiten, falls vorhanden. |
CelebritiesModel
Ein Objekt, das mögliche Prominentenidentifikation beschreibt.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number (double) |
Konfidenzniveau für die Prominentenerkennung als Wert von 0 bis 1. |
faceRectangle |
Position des identifizierten Gesichts im Bild. |
|
name |
string |
Name des Prominenten. |
ColorInfo
Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.
Name | Typ | Beschreibung |
---|---|---|
accentColor |
string |
Mögliche Akzentfarbe. |
dominantColorBackground |
string |
Mögliche dominante Hintergrundfarbe. |
dominantColorForeground |
string |
Mögliche dominante Vordergrundfarbe. |
dominantColors |
string[] |
Ein Array möglicher dominanter Farben. |
isBWImg |
boolean |
Ein Wert, der angibt, ob das Bild schwarzweiß ist. |
ComputerVisionError
Der API-Anforderungsfehler.
Name | Typ | Beschreibung |
---|---|---|
code |
Der Fehlercode. |
|
innererror |
Innerer Fehler enthält spezifischere Informationen. |
|
message |
string |
Eine Meldung, die den vom Dienst gemeldeten Fehler erklärt. |
ComputerVisionErrorCodes
Der Fehlercode.
Wert | Beschreibung |
---|---|
InternalServerError | |
InvalidArgument | |
InvalidRequest | |
ServiceUnavailable |
ComputerVisionErrorResponse
Die API-Fehlerantwort.
Name | Typ | Beschreibung |
---|---|---|
error |
Fehlerinhalte. |
ComputerVisionInnerError
Details zum API-Anforderungsfehler.
Name | Typ | Beschreibung |
---|---|---|
code |
Der Fehlercode. |
|
message |
string |
Fehlermeldung. |
ComputerVisionInnerErrorCodeValue
Der Fehlercode.
Wert | Beschreibung |
---|---|
BadArgument | |
CancelledRequest | |
DetectFaceError | |
FailedToProcess | |
InternalServerError | |
InvalidDetails | |
InvalidImageFormat | |
InvalidImageSize | |
InvalidImageUrl | |
InvalidModel | |
InvalidThumbnailSize | |
NotSupportedFeature | |
NotSupportedImage | |
NotSupportedLanguage | |
NotSupportedVisualFeature | |
StorageException | |
Timeout | |
Unspecified | |
UnsupportedMediaType |
DescriptionExclude
Deaktivieren Sie beim Generieren der Beschreibung angegebene Domänenmodelle.
Wert | Beschreibung |
---|---|
Celebrities | |
Landmarks |
Details
Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Prominente - identifiziert Prominente, wenn in dem Bild erkannt, Landmarks - identifiziert wichtige Sehenswürdigkeiten im Bild.
Wert | Beschreibung |
---|---|
Celebrities | |
Landmarks |
DetectedBrand
Eine Marke, die in einem Bild erkannt wurde.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number (double) |
Konfidenzbewertung, dass die Marke im Bild als Wert zwischen 0 und 1 beobachtet wurde. |
name |
string |
Marke für die Marke. |
rectangle |
Ungefährer Standort der erkannten Marke. |
DetectedObject
Ein Objekt, das in einem Bild erkannt wurde.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number (double) |
Konfidenzbewertung, dass das Objekt im Bild als Wert zwischen 0 und 1 beobachtet wurde. |
object |
string |
Bezeichnung für das Objekt. |
parent |
Das übergeordnete Objekt aus Taxonomieperspektive. Das übergeordnete Objekt ist eine allgemeinere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben. |
|
rectangle |
Ungefähre Position des erkannten Objekts. |
FaceDescription
Ein Objekt, das ein im Bild identifiziertes Gesicht beschreibt.
Name | Typ | Beschreibung |
---|---|---|
age |
integer (int32) |
Mögliches Alter des Gesichtes. |
faceRectangle |
Rechteck im Bild, das das identifizierte Gesicht enthält. |
|
gender |
Mögliches Geschlecht des Gesichtes. |
FaceRectangle
Ein Objekt, das das Gesichtsrechteck beschreibt.
Name | Typ | Beschreibung |
---|---|---|
height |
integer (int32) |
Höhe gemessen vom oberen linken Punkt des Gesichts in Pixel. |
left |
integer (int32) |
X-Koordinate des oberen linken Punkts des Gesichts in Pixeln. |
top |
integer (int32) |
Y-Koordinate des oberen linken Punkts des Gesichts in Pixeln. |
width |
integer (int32) |
Breite gemessen vom oberen linken Punkt des Gesichtes in Pixel. |
Gender
Mögliches Geschlecht des Gesichtes.
Wert | Beschreibung |
---|---|
Female | |
Male |
ImageAnalysis
Ergebnis des AnalyzeImage-Vorgangs.
Name | Typ | Beschreibung |
---|---|---|
adult |
Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder rassig ist. |
|
brands |
Array von Marken, die im Bild erkannt wurden. |
|
categories |
Category[] |
Ein Array, das identifizierte Kategorien angibt. |
color |
Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt. |
|
description |
Eine Sammlung von Inhaltstags sowie eine Liste der Beschriftungen, sortiert nach Konfidenzniveau und Bildmetadaten. |
|
faces |
Ein Array möglicher Gesichter innerhalb des Bilds. |
|
imageType |
Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt. |
|
metadata |
Bildmetadaten. |
|
modelVersion |
string pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$ |
Version des KI-Modells. |
objects |
Array von Objekten, die beschreiben, was im Bild erkannt wurde. |
|
requestId |
string |
ID der REST-API-Anforderung. |
tags |
Image |
Eine Liste von Tags mit Konfidenzniveau. |
ImageCaption
Eine Bildbeschriftung, d. h. eine kurze Beschreibung der Darstellung des Bilds.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number (double) |
Die Vertrauensstufe, die der Dienst in der Beschriftung hat. |
text |
string |
Der Text der Beschriftung. |
ImageDescriptionDetails
Eine Sammlung von Inhaltstags sowie eine Liste der Beschriftungen, sortiert nach Konfidenzniveau und Bildmetadaten.
Name | Typ | Beschreibung |
---|---|---|
captions |
Eine Liste der Beschriftungen, sortiert nach Konfidenzniveau. |
|
tags |
string[] |
Eine Sammlung von Bildtags. |
ImageMetadata
Bildmetadaten.
Name | Typ | Beschreibung |
---|---|---|
format |
string |
Bildformat. |
height |
integer (int32) |
Bildhöhe in Pixel. |
width |
integer (int32) |
Bildbreite in Pixel. |
ImageTag
Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number (double) |
Die Vertrauensstufe, die die Entität beobachtet hat. |
hint |
string |
Optionaler Hinweis/Details für dieses Tag. |
name |
string |
Name der Entität. |
ImageType
Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.
Name | Typ | Beschreibung |
---|---|---|
clipArtType |
integer (int32) |
Konfidenzniveau, dass es sich bei dem Bild um ein ClipArt-Objekt handelt. |
lineDrawingType |
integer (int32) |
Konfidenzstufe, dass das Bild eine Linienzeichnung ist. |
LandmarksModel
Ein Wahrzeichen, das im Bild erkannt wird.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number (double) |
Konfidenzniveau für die Orientierungserkennung als Wert zwischen 0 und 1. |
name |
string |
Name des Wahrzeichens. |
ObjectHierarchy
Ein Objekt, das in einem Bild erkannt wurde.
Name | Typ | Beschreibung |
---|---|---|
confidence |
number (double) |
Konfidenzbewertung, dass das Objekt im Bild als Wert zwischen 0 und 1 beobachtet wurde. |
object |
string |
Bezeichnung für das Objekt. |
parent |
Das übergeordnete Objekt aus Taxonomieperspektive. Das übergeordnete Objekt ist eine allgemeinere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben. |
VisualFeatureTypes
Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Kategorien – kategorisiert Bildinhalte gemäß einer taxonomie, die in der Dokumentation definiert ist. Tags – markiert das Bild mit einer detaillierten Liste von Wörtern im Zusammenhang mit dem Bildinhalt. Beschreibung : Beschreibt den Bildinhalt mit einem vollständigen englischen Satz. Gesichter – erkennt, ob Gesichter vorhanden sind. Wenn vorhanden, generieren Sie Koordinaten, Geschlecht und Alter. ImageType – erkennt, ob das Bild ClipArt oder eine Linienzeichnung ist. Farbe – bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsene - erkennt, ob das Bild pornografische Natur ist (stellt Nacktheit oder sexakt dar), oder ist Gory (zeigt extreme Gewalt oder Blut). Sexuelle suggestive Inhalte (auch bekannt als rassige Inhalte) werden ebenfalls erkannt. Objekte – erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken - erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Argument Marken ist nur in Englisch verfügbar.
Wert | Beschreibung |
---|---|
Adult | |
Brands | |
Categories | |
Color | |
Description | |
Faces | |
ImageType | |
Objects | |
Tags |