Freigeben über


Analyze Image In Stream - Analyze Image In Stream

Dieser Vorgang extrahiert einen umfassenden Satz visueller Features basierend auf dem Bildinhalt. Zwei Eingabemethoden werden unterstützt : (1) Hochladen eines Bilds oder (2) Angeben einer Bild-URL. Innerhalb Ihrer Anforderung gibt es einen optionalen Parameter, mit dem Sie auswählen können, welche Features zurückgegeben werden sollen. Standardmäßig werden Bildkategorien in der Antwort zurückgegeben. Eine erfolgreiche Antwort wird in JSON zurückgegeben. Wenn die Anforderung fehlgeschlagen ist, enthält die Antwort einen Fehlercode und eine Meldung, um zu verstehen, was nicht geklappt hat.

POST {Endpoint}/vision/v3.2/analyze
POST {Endpoint}/vision/v3.2/analyze?overload=stream&visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}&model-version={model-version}

URI-Parameter

Name In Erforderlich Typ Beschreibung
Endpoint
path True

string

Unterstützte Cognitive Services-Endpunkte.

descriptionExclude
query

DescriptionExclude[]

Deaktivieren Sie beim Generieren der Beschreibung angegebene Domänenmodelle.

details
query

Details[]

Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Prominente - identifiziert Prominente, wenn in dem Bild erkannt, Landmarks - identifiziert wichtige Sehenswürdigkeiten im Bild.

language
query

string

Die gewünschte Sprache für die Ausgabegenerierung. Wenn dieser Parameter nicht angegeben ist, lautet der Standardwert "en". Eine Liste der unterstützten Sprachen finden Sie unter https://aka.ms/cv-languages.

model-version
query

string

pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$

Optionaler Parameter zum Angeben der Version des KI-Modells. Akzeptierte Werte sind: "latest", "2021-04-01", "2021-05-01". Der Standardwert ist "latest".

visualFeatures
query

VisualFeatureTypes[]

Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Kategorien – kategorisiert Bildinhalte gemäß einer taxonomie, die in der Dokumentation definiert ist. Tags – markiert das Bild mit einer detaillierten Liste von Wörtern im Zusammenhang mit dem Bildinhalt. Beschreibung : Beschreibt den Bildinhalt mit einem vollständigen englischen Satz. Gesichter – erkennt, ob Gesichter vorhanden sind. Wenn vorhanden, generieren Sie Koordinaten, Geschlecht und Alter. ImageType – erkennt, ob das Bild ClipArt oder eine Linienzeichnung ist. Farbe – bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsene - erkennt, ob das Bild pornografische Natur ist (stellt Nacktheit oder sexakt dar), oder ist Gory (zeigt extreme Gewalt oder Blut). Sexuelle suggestive Inhalte (auch bekannt als rassige Inhalte) werden ebenfalls erkannt. Objekte – erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken - erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Argument Marken ist nur in Englisch verfügbar.

Anforderungsheader

Media Types: "application/octet-stream", "multipart/form-data"

Name Erforderlich Typ Beschreibung
Ocp-Apim-Subscription-Key True

string

Anforderungstext

Media Types: "application/octet-stream", "multipart/form-data"

Name Typ Beschreibung
Image

object (file)

Ein Bildstream.

Antworten

Name Typ Beschreibung
200 OK

ImageAnalysis

Die Antwort enthält die extrahierten Features im JSON-Format. Hier sind die Definitionen für Enumerationstypen:

ClipartType

Non - clipart = 0, mehrdeutig = 1, normal - clipart = 2, good - clipart = 3. LineDrawingTypeNon - LineDrawing = 0, LineDrawing = 1.

Other Status Codes

ComputerVisionErrorResponse

Fehlerantwort.

Sicherheit

Ocp-Apim-Subscription-Key

Typ: apiKey
In: header

Beispiele

Successful AnalyzeImage request

Beispielanforderung

POST https://westus.api.cognitive.microsoft.com/vision/v3.2/analyze?overload=stream&visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en


"{binary}"

Beispiel für eine Antwort

{
  "categories": [
    {
      "name": "abstract_",
      "score": 0.00390625
    },
    {
      "name": "people_",
      "score": 0.83984375,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 597,
              "top": 162,
              "width": 248,
              "height": 248
            },
            "confidence": 0.999028444
          }
        ],
        "landmarks": [
          {
            "name": "Forbidden City",
            "confidence": 0.9978346
          }
        ]
      }
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isRacyContent": false,
    "isGoryContent": false,
    "adultScore": 0.0934349000453949,
    "racyScore": 0.06861349195241928,
    "goreScore": 0.012872257380997575
  },
  "tags": [
    {
      "name": "person",
      "confidence": 0.9897908568382263
    },
    {
      "name": "man",
      "confidence": 0.9449388980865479
    },
    {
      "name": "outdoor",
      "confidence": 0.938492476940155
    },
    {
      "name": "window",
      "confidence": 0.8951393961906433
    },
    {
      "name": "pangolin",
      "confidence": 0.7250059783791661,
      "hint": "mammal"
    }
  ],
  "description": {
    "tags": [
      "person",
      "man",
      "outdoor",
      "window",
      "glasses"
    ],
    "captions": [
      {
        "text": "Satya Nadella sitting on a bench",
        "confidence": 0.48293603002174407
      }
    ]
  },
  "requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
  "metadata": {
    "width": 1500,
    "height": 1000,
    "format": "Jpeg"
  },
  "modelVersion": "2021-04-01",
  "faces": [
    {
      "age": 44,
      "gender": "Male",
      "faceRectangle": {
        "left": 593,
        "top": 160,
        "width": 250,
        "height": 250
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Brown",
    "dominantColorBackground": "Brown",
    "dominantColors": [
      "Brown",
      "Black"
    ],
    "accentColor": "873B59",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "objects": [
    {
      "rectangle": {
        "x": 0,
        "y": 0,
        "w": 50,
        "h": 50
      },
      "object": "tree",
      "confidence": 0.9,
      "parent": {
        "object": "plant",
        "confidence": 0.95
      }
    }
  ],
  "brands": [
    {
      "name": "Pepsi",
      "confidence": 0.857,
      "rectangle": {
        "x": 489,
        "y": 79,
        "w": 161,
        "h": 177
      }
    },
    {
      "name": "Coca-Cola",
      "confidence": 0.893,
      "rectangle": {
        "x": 216,
        "y": 55,
        "w": 171,
        "h": 372
      }
    }
  ]
}

Definitionen

Name Beschreibung
AdultInfo

Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder rassig ist.

BoundingRect

Ein umgebendes Feld für einen Bereich innerhalb eines Bilds.

Category

Ein Objekt, das die identifizierte Kategorie beschreibt.

CategoryDetail

Ein Objekt, das zusätzliche Kategoriedetails beschreibt.

CelebritiesModel

Ein Objekt, das mögliche Prominentenidentifikation beschreibt.

ColorInfo

Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.

ComputerVisionError

Der API-Anforderungsfehler.

ComputerVisionErrorCodes

Der Fehlercode.

ComputerVisionErrorResponse

Die API-Fehlerantwort.

ComputerVisionInnerError

Details zum API-Anforderungsfehler.

ComputerVisionInnerErrorCodeValue

Der Fehlercode.

DescriptionExclude

Deaktivieren Sie beim Generieren der Beschreibung angegebene Domänenmodelle.

Details

Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Prominente - identifiziert Prominente, wenn in dem Bild erkannt, Landmarks - identifiziert wichtige Sehenswürdigkeiten im Bild.

DetectedBrand

Eine Marke, die in einem Bild erkannt wurde.

DetectedObject

Ein Objekt, das in einem Bild erkannt wurde.

FaceDescription

Ein Objekt, das ein im Bild identifiziertes Gesicht beschreibt.

FaceRectangle

Ein Objekt, das das Gesichtsrechteck beschreibt.

Gender

Mögliches Geschlecht des Gesichtes.

ImageAnalysis

Ergebnis des AnalyzeImage-Vorgangs.

ImageCaption

Eine Bildbeschriftung, d. h. eine kurze Beschreibung der Darstellung des Bilds.

ImageDescriptionDetails

Eine Sammlung von Inhaltstags sowie eine Liste der Beschriftungen, sortiert nach Konfidenzniveau und Bildmetadaten.

ImageMetadata

Bildmetadaten.

ImageTag

Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung.

ImageType

Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.

LandmarksModel

Ein Wahrzeichen, das im Bild erkannt wird.

ObjectHierarchy

Ein Objekt, das in einem Bild erkannt wurde.

VisualFeatureTypes

Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Kategorien – kategorisiert Bildinhalte gemäß einer taxonomie, die in der Dokumentation definiert ist. Tags – markiert das Bild mit einer detaillierten Liste von Wörtern im Zusammenhang mit dem Bildinhalt. Beschreibung : Beschreibt den Bildinhalt mit einem vollständigen englischen Satz. Gesichter – erkennt, ob Gesichter vorhanden sind. Wenn vorhanden, generieren Sie Koordinaten, Geschlecht und Alter. ImageType – erkennt, ob das Bild ClipArt oder eine Linienzeichnung ist. Farbe – bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsene - erkennt, ob das Bild pornografische Natur ist (stellt Nacktheit oder sexakt dar), oder ist Gory (zeigt extreme Gewalt oder Blut). Sexuelle suggestive Inhalte (auch bekannt als rassige Inhalte) werden ebenfalls erkannt. Objekte – erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken - erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Argument Marken ist nur in Englisch verfügbar.

AdultInfo

Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder rassig ist.

Name Typ Beschreibung
adultScore

number (double)

Bewertung von 0 bis 1, die angibt, wie viel der Inhalt als erwachsener Innerhalb des Bilds betrachtet wird.

goreScore

number (double)

Bewertung von 0 bis 1, die angibt, wie Gory das Bild ist.

isAdultContent

boolean

Ein Wert, der angibt, ob das Bild erwachsene Inhalte enthält.

isGoryContent

boolean

Ein Wert, der angibt, ob das Bild gory ist.

isRacyContent

boolean

Ein Wert, der angibt, ob das Bild racy ist.

racyScore

number (double)

Bewertung von 0 bis 1, die angibt, wie suggestiv das Bild ist.

BoundingRect

Ein umgebendes Feld für einen Bereich innerhalb eines Bilds.

Name Typ Beschreibung
h

integer (int32)

Höhe gemessen vom linken oberen Punkt des Bereichs in Pixel.

w

integer (int32)

Breite gemessen vom oberen linken Punkt des Bereichs in Pixel.

x

integer (int32)

X-Koordinate des oberen linken Punkts des Bereichs in Pixel.

y

integer (int32)

Y-Koordinate des oberen linken Punkts des Bereichs in Pixel.

Category

Ein Objekt, das die identifizierte Kategorie beschreibt.

Name Typ Beschreibung
detail

CategoryDetail

Details der identifizierten Kategorie.

name

string

Name der Kategorie.

score

number (double)

Bewertung der Kategorie.

CategoryDetail

Ein Objekt, das zusätzliche Kategoriedetails beschreibt.

Name Typ Beschreibung
celebrities

CelebritiesModel[]

Eine Reihe von Prominenten, wenn vorhanden.

landmarks

LandmarksModel[]

Ein Array von Sehenswürdigkeiten, falls vorhanden.

CelebritiesModel

Ein Objekt, das mögliche Prominentenidentifikation beschreibt.

Name Typ Beschreibung
confidence

number (double)

Konfidenzniveau für die Prominentenerkennung als Wert von 0 bis 1.

faceRectangle

FaceRectangle

Position des identifizierten Gesichts im Bild.

name

string

Name des Prominenten.

ColorInfo

Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.

Name Typ Beschreibung
accentColor

string

Mögliche Akzentfarbe.

dominantColorBackground

string

Mögliche dominante Hintergrundfarbe.

dominantColorForeground

string

Mögliche dominante Vordergrundfarbe.

dominantColors

string[]

Ein Array möglicher dominanter Farben.

isBWImg

boolean

Ein Wert, der angibt, ob das Bild schwarzweiß ist.

ComputerVisionError

Der API-Anforderungsfehler.

Name Typ Beschreibung
code

ComputerVisionErrorCodes

Der Fehlercode.

innererror

ComputerVisionInnerError

Innerer Fehler enthält spezifischere Informationen.

message

string

Eine Meldung, die den vom Dienst gemeldeten Fehler erklärt.

ComputerVisionErrorCodes

Der Fehlercode.

Wert Beschreibung
InternalServerError
InvalidArgument
InvalidRequest
ServiceUnavailable

ComputerVisionErrorResponse

Die API-Fehlerantwort.

Name Typ Beschreibung
error

ComputerVisionError

Fehlerinhalte.

ComputerVisionInnerError

Details zum API-Anforderungsfehler.

Name Typ Beschreibung
code

ComputerVisionInnerErrorCodeValue

Der Fehlercode.

message

string

Fehlermeldung.

ComputerVisionInnerErrorCodeValue

Der Fehlercode.

Wert Beschreibung
BadArgument
CancelledRequest
DetectFaceError
FailedToProcess
InternalServerError
InvalidDetails
InvalidImageFormat
InvalidImageSize
InvalidImageUrl
InvalidModel
InvalidThumbnailSize
NotSupportedFeature
NotSupportedImage
NotSupportedLanguage
NotSupportedVisualFeature
StorageException
Timeout
Unspecified
UnsupportedMediaType

DescriptionExclude

Deaktivieren Sie beim Generieren der Beschreibung angegebene Domänenmodelle.

Wert Beschreibung
Celebrities
Landmarks

Details

Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Prominente - identifiziert Prominente, wenn in dem Bild erkannt, Landmarks - identifiziert wichtige Sehenswürdigkeiten im Bild.

Wert Beschreibung
Celebrities
Landmarks

DetectedBrand

Eine Marke, die in einem Bild erkannt wurde.

Name Typ Beschreibung
confidence

number (double)

Konfidenzbewertung, dass die Marke im Bild als Wert zwischen 0 und 1 beobachtet wurde.

name

string

Marke für die Marke.

rectangle

BoundingRect

Ungefährer Standort der erkannten Marke.

DetectedObject

Ein Objekt, das in einem Bild erkannt wurde.

Name Typ Beschreibung
confidence

number (double)

Konfidenzbewertung, dass das Objekt im Bild als Wert zwischen 0 und 1 beobachtet wurde.

object

string

Bezeichnung für das Objekt.

parent

ObjectHierarchy

Das übergeordnete Objekt aus Taxonomieperspektive. Das übergeordnete Objekt ist eine allgemeinere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben.

rectangle

BoundingRect

Ungefähre Position des erkannten Objekts.

FaceDescription

Ein Objekt, das ein im Bild identifiziertes Gesicht beschreibt.

Name Typ Beschreibung
age

integer (int32)

Mögliches Alter des Gesichtes.

faceRectangle

FaceRectangle

Rechteck im Bild, das das identifizierte Gesicht enthält.

gender

Gender

Mögliches Geschlecht des Gesichtes.

FaceRectangle

Ein Objekt, das das Gesichtsrechteck beschreibt.

Name Typ Beschreibung
height

integer (int32)

Höhe gemessen vom oberen linken Punkt des Gesichts in Pixel.

left

integer (int32)

X-Koordinate des oberen linken Punkts des Gesichts in Pixeln.

top

integer (int32)

Y-Koordinate des oberen linken Punkts des Gesichts in Pixeln.

width

integer (int32)

Breite gemessen vom oberen linken Punkt des Gesichtes in Pixel.

Gender

Mögliches Geschlecht des Gesichtes.

Wert Beschreibung
Female
Male

ImageAnalysis

Ergebnis des AnalyzeImage-Vorgangs.

Name Typ Beschreibung
adult

AdultInfo

Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder rassig ist.

brands

DetectedBrand[]

Array von Marken, die im Bild erkannt wurden.

categories

Category[]

Ein Array, das identifizierte Kategorien angibt.

color

ColorInfo

Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.

description

ImageDescriptionDetails

Eine Sammlung von Inhaltstags sowie eine Liste der Beschriftungen, sortiert nach Konfidenzniveau und Bildmetadaten.

faces

FaceDescription[]

Ein Array möglicher Gesichter innerhalb des Bilds.

imageType

ImageType

Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.

metadata

ImageMetadata

Bildmetadaten.

modelVersion

string

pattern: ^(latest|\d{4}-\d{2}-\d{2})(-preview)?$

Version des KI-Modells.

objects

DetectedObject[]

Array von Objekten, die beschreiben, was im Bild erkannt wurde.

requestId

string

ID der REST-API-Anforderung.

tags

ImageTag[]

Eine Liste von Tags mit Konfidenzniveau.

ImageCaption

Eine Bildbeschriftung, d. h. eine kurze Beschreibung der Darstellung des Bilds.

Name Typ Beschreibung
confidence

number (double)

Die Vertrauensstufe, die der Dienst in der Beschriftung hat.

text

string

Der Text der Beschriftung.

ImageDescriptionDetails

Eine Sammlung von Inhaltstags sowie eine Liste der Beschriftungen, sortiert nach Konfidenzniveau und Bildmetadaten.

Name Typ Beschreibung
captions

ImageCaption[]

Eine Liste der Beschriftungen, sortiert nach Konfidenzniveau.

tags

string[]

Eine Sammlung von Bildtags.

ImageMetadata

Bildmetadaten.

Name Typ Beschreibung
format

string

Bildformat.

height

integer (int32)

Bildhöhe in Pixel.

width

integer (int32)

Bildbreite in Pixel.

ImageTag

Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung.

Name Typ Beschreibung
confidence

number (double)

Die Vertrauensstufe, die die Entität beobachtet hat.

hint

string

Optionaler Hinweis/Details für dieses Tag.

name

string

Name der Entität.

ImageType

Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.

Name Typ Beschreibung
clipArtType

integer (int32)

Konfidenzniveau, dass es sich bei dem Bild um ein ClipArt-Objekt handelt.

lineDrawingType

integer (int32)

Konfidenzstufe, dass das Bild eine Linienzeichnung ist.

LandmarksModel

Ein Wahrzeichen, das im Bild erkannt wird.

Name Typ Beschreibung
confidence

number (double)

Konfidenzniveau für die Orientierungserkennung als Wert zwischen 0 und 1.

name

string

Name des Wahrzeichens.

ObjectHierarchy

Ein Objekt, das in einem Bild erkannt wurde.

Name Typ Beschreibung
confidence

number (double)

Konfidenzbewertung, dass das Objekt im Bild als Wert zwischen 0 und 1 beobachtet wurde.

object

string

Bezeichnung für das Objekt.

parent

ObjectHierarchy

Das übergeordnete Objekt aus Taxonomieperspektive. Das übergeordnete Objekt ist eine allgemeinere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben.

VisualFeatureTypes

Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Kommas getrennt werden. Gültige visuelle Featuretypen sind: Kategorien – kategorisiert Bildinhalte gemäß einer taxonomie, die in der Dokumentation definiert ist. Tags – markiert das Bild mit einer detaillierten Liste von Wörtern im Zusammenhang mit dem Bildinhalt. Beschreibung : Beschreibt den Bildinhalt mit einem vollständigen englischen Satz. Gesichter – erkennt, ob Gesichter vorhanden sind. Wenn vorhanden, generieren Sie Koordinaten, Geschlecht und Alter. ImageType – erkennt, ob das Bild ClipArt oder eine Linienzeichnung ist. Farbe – bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsene - erkennt, ob das Bild pornografische Natur ist (stellt Nacktheit oder sexakt dar), oder ist Gory (zeigt extreme Gewalt oder Blut). Sexuelle suggestive Inhalte (auch bekannt als rassige Inhalte) werden ebenfalls erkannt. Objekte – erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken - erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Argument Marken ist nur in Englisch verfügbar.

Wert Beschreibung
Adult
Brands
Categories
Color
Description
Faces
ImageType
Objects
Tags