Freigeben über


Analyze Image - Analyze Image

Durch diesen Vorgang wird ein umfangreicher Satz von Visualfeatures basierend auf dem Bildinhalt extrahiert. Zwei Eingabemethoden werden unterstützt: (1) Hochladen eines Bilds oder (2) Angeben einer Bild-URL. In Ihrer Anforderung gibt es einen optionalen Parameter, mit dem Sie auswählen können, welche Features zurückgegeben werden sollen. Standardmäßig werden Bildkategorien in der Antwort zurückgegeben. Eine erfolgreiche Antwort wird in JSON zurückgegeben. Wenn die Anforderung fehlgeschlagen ist, enthält die Antwort einen Fehlercode und eine Meldung, um zu verstehen, was falsch gelaufen ist.

POST {Endpoint}/vision/v3.1/analyze
POST {Endpoint}/vision/v3.1/analyze?visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}

URI-Parameter

Name In Erforderlich Typ Beschreibung
Endpoint
path True

string

Unterstützte Cognitive Services-Endpunkte.

descriptionExclude
query

DescriptionExclude[]

Deaktivieren Sie die angegebenen Domänenmodelle beim Generieren der Beschreibung.

details
query

Details[]

Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt werden. Gültige visuelle Featuretypen sind: Prominente – identifiziert Prominente, wenn sie im Bild erkannt werden, Wahrzeichen – identifiziert wichtige Sehenswürdigkeiten im Bild.

language
query

string

Die gewünschte Sprache für die Ausgabegenerierung. Wenn dieser Parameter nicht angegeben ist, lautet der Standardwert "en". Unterstützte Sprachen:en - Englisch, Standard. es - Spanisch, ja - Japanisch, pt - Portugiesisch, zh - Vereinfachtes Chinesisch.

visualFeatures
query

VisualFeatureTypes[]

Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt werden. Gültige visuelle Featuretypen umfassen: Kategorien : Kategorisiert Bildinhalte gemäß einer in der Dokumentation definierten Taxonomie. Tags: Markiert das Bild mit einer detaillierten Liste von Wörtern im Zusammenhang mit dem Bildinhalt. Description: Beschreibt den Bildinhalt mit einem vollständigen Satz. Gesichter: Erkennt, ob Gesichter vorhanden sind. Wenn Gesichter vorhanden sind, generiert dieses Merkmal Informationen zu Koordinaten, Geschlecht und Alter. ImageType: Erkennt, ob das Bild eine pixelbasierte Rastergrafik oder eine linienbasierte Vektorgrafik ist. Farbe: Bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsener - erkennt, ob das Bild pornografischer Natur ist (zeigt Nacktheit oder einen Sexualakt) oder ist gory (zeigt extreme Gewalt oder Blut). Zweideutige und freizügige Inhalte werden ebenfalls erkannt. Objekte: Erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken : Erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Brands-Argument ist nur für Englisch verfügbar.

Anforderungsheader

Name Erforderlich Typ Beschreibung
Ocp-Apim-Subscription-Key True

string

Anforderungstext

Name Erforderlich Typ Beschreibung
url True

string

Öffentlich erreichbare URL eines Bilds.

Antworten

Name Typ Beschreibung
200 OK

ImageAnalysis

Die Antwort enthält die extrahierten Features im JSON-Format. Hier sehen Sie die Definitionen für Enumerationstypen:

ClipartType

Nicht - clipart = 0, mehrdeutig = 1, normal - clipart = 2, good - clipart = 3. LineDrawingTypeNon – LineDrawing = 0, LineDrawing = 1.

Other Status Codes

ComputerVisionError

Fehlerantwort.

Sicherheit

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Beispiele

Successful AnalyzeImage request

Sample Request

POST https://westus.api.cognitive.microsoft.com/vision/v3.1/analyze?visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en


{
  "url": "{url}"
}

Sample Response

{
  "categories": [
    {
      "name": "abstract_",
      "score": 0.00390625
    },
    {
      "name": "people_",
      "score": 0.83984375,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 597,
              "top": 162,
              "width": 248,
              "height": 248
            },
            "confidence": 0.999028444
          }
        ]
      }
    },
    {
      "name": "building_",
      "score": 0.984375,
      "detail": {
        "landmarks": [
          {
            "name": "Forbidden City",
            "confidence": 0.9829016923904419
          }
        ]
      }
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isRacyContent": false,
    "isGoryContent": false,
    "adultScore": 0.0934349000453949,
    "racyScore": 0.06861349195241928,
    "goreScore": 0.012872257380997575
  },
  "tags": [
    {
      "name": "person",
      "confidence": 0.9897908568382263
    },
    {
      "name": "man",
      "confidence": 0.9449388980865479
    },
    {
      "name": "outdoor",
      "confidence": 0.938492476940155
    },
    {
      "name": "window",
      "confidence": 0.8951393961906433
    },
    {
      "name": "pangolin",
      "confidence": 0.7250059783791661,
      "hint": "mammal"
    }
  ],
  "description": {
    "tags": [
      "person",
      "man",
      "outdoor",
      "window",
      "glasses"
    ],
    "captions": [
      {
        "text": "Satya Nadella sitting on a bench",
        "confidence": 0.48293603002174407
      }
    ]
  },
  "requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
  "metadata": {
    "width": 1500,
    "height": 1000,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 44,
      "gender": "Male",
      "faceRectangle": {
        "left": 593,
        "top": 160,
        "width": 250,
        "height": 250
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Brown",
    "dominantColorBackground": "Brown",
    "dominantColors": [
      "Brown",
      "Black"
    ],
    "accentColor": "873B59",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "objects": [
    {
      "rectangle": {
        "x": 0,
        "y": 0,
        "w": 50,
        "h": 50
      },
      "object": "tree",
      "confidence": 0.9,
      "parent": {
        "object": "plant",
        "confidence": 0.95
      }
    }
  ],
  "brands": [
    {
      "name": "Pepsi",
      "confidence": 0.857,
      "rectangle": {
        "x": 489,
        "y": 79,
        "w": 161,
        "h": 177
      }
    },
    {
      "name": "Coca-Cola",
      "confidence": 0.893,
      "rectangle": {
        "x": 216,
        "y": 55,
        "w": 171,
        "h": 372
      }
    }
  ]
}

Definitionen

Name Beschreibung
AdultInfo

Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder gleich ist.

BoundingRect

Ein Begrenzungsrahmen für einen Bereich innerhalb eines Bilds.

Category

Ein Objekt, das die identifizierte Kategorie beschreibt.

CategoryDetail

Ein Objekt, das zusätzliche Kategoriedetails beschreibt.

CelebritiesModel

Ein Objekt, das eine mögliche Prominentenidentifikation beschreibt.

ColorInfo

Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.

ComputerVisionError

Details zum API-Anforderungsfehler.

ComputerVisionErrorCodes

Der Fehlercode.

DescriptionExclude

Deaktivieren Sie die angegebenen Domänenmodelle beim Generieren der Beschreibung.

Details

Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Prominente - identifiziert Prominente, wenn sie im Bild erkannt werden, Wahrzeichen - identifiziert bemerkenswerte Sehenswürdigkeiten im Bild.

DetectedBrand

Eine Marke, die in einem Bild erkannt wurde.

DetectedObject

Ein in einem Bild erkanntes Objekt.

FaceDescription

Ein Objekt, das eine im Bild identifizierte Gesichtserkennung beschreibt.

FaceRectangle

Ein Objekt, das das Gesichtsrechteck beschreibt.

Gender

Mögliches Geschlecht des Gesichts.

ImageAnalysis

Ergebnis des AnalyzeImage-Vorgangs.

ImageCaption

Ein Bild Untertitel, d.h. eine kurze Beschreibung des Bildes.

ImageDescriptionDetails

Eine Sammlung von Inhaltstags zusammen mit einer Liste von Untertiteln, die nach Konfidenzniveau und Bildmetadaten sortiert sind.

ImageMetadata

Bildmetadaten.

ImageTag

Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung.

ImageType

Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.

ImageUrl
LandmarksModel

Ein im Bild erkanntes Wahrzeichen.

ObjectHierarchy

Ein Objekt, das in einem Bild erkannt wurde.

VisualFeatureTypes

Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Kategorien : Kategorisiert Bildinhalte gemäß einer in der Dokumentation definierten Taxonomie. Tags: Markiert das Bild mit einer detaillierten Liste von Wörtern, die sich auf den Bildinhalt beziehen. Description: Beschreibt den Bildinhalt mit einem vollständigen Satz. Gesichter: Erkennt, ob Gesichter vorhanden sind. Wenn Gesichter vorhanden sind, generiert dieses Merkmal Informationen zu Koordinaten, Geschlecht und Alter. ImageType: Erkennt, ob das Bild eine pixelbasierte Rastergrafik oder eine linienbasierte Vektorgrafik ist. Farbe: Bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsener - erkennt, ob das Bild pornografischer Natur ist (zeigt Nacktheit oder einen Sexualakt), oder ist gory (zeigt extreme Gewalt oder Blut). Zweideutige und freizügige Inhalte werden ebenfalls erkannt. Objekte: Erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken: Erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Brands-Argument ist nur für Englisch verfügbar.

AdultInfo

Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder gleich ist.

Name Typ Beschreibung
adultScore

number

Bewertung von 0 bis 1, die angibt, wie sehr der Inhalt innerhalb des Bilds als erwachsenenorientiert betrachtet wird.

goreScore

number

Eine Bewertung von 0 bis 1, die angibt, wie das Bild gory ist.

isAdultContent

boolean

Ein Wert, der angibt, ob das Bild inhalte für erwachsene Benutzer enthält.

isGoryContent

boolean

Ein Wert, der angibt, ob das Bild gory ist.

isRacyContent

boolean

Ein Wert, der angibt, ob das Bild gleich ist.

racyScore

number

Bewertung von 0 bis 1, die angibt, wie suggestiv das Bild ist.

BoundingRect

Ein Begrenzungsrahmen für einen Bereich innerhalb eines Bilds.

Name Typ Beschreibung
h

integer

Gemessene Höhe des linken oberen Punkts des Bereichs, in Pixeln.

w

integer

Gemessene Breite des linken oberen Punkts des Bereichs, in Pixeln.

x

integer

X-Koordinate des oberen linken Punkts des Bereichs in Pixel.

y

integer

Y-Koordinate des oberen linken Punkts des Bereichs in Pixeln.

Category

Ein Objekt, das die identifizierte Kategorie beschreibt.

Name Typ Beschreibung
detail

CategoryDetail

Details der identifizierten Kategorie.

name

string

Name der Kategorie

score

number

Bewertung der Kategorie.

CategoryDetail

Ein Objekt, das zusätzliche Kategoriedetails beschreibt.

Name Typ Beschreibung
celebrities

CelebritiesModel[]

Eine Reihe von Prominenten, falls vorhanden.

landmarks

LandmarksModel[]

Ein Array von Orientierungspunkten, falls vorhanden.

CelebritiesModel

Ein Objekt, das eine mögliche Prominentenidentifikation beschreibt.

Name Typ Beschreibung
confidence

number

Konfidenzstufe für die Prominentenerkennung als Wert von 0 bis 1.

faceRectangle

FaceRectangle

Position des identifizierten Gesichts im Bild.

name

string

Name des Prominenten.

ColorInfo

Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.

Name Typ Beschreibung
accentColor

string

Mögliche Akzentfarbe.

dominantColorBackground

string

Mögliche dominante Hintergrundfarbe.

dominantColorForeground

string

Mögliche dominante Vordergrundfarbe.

dominantColors

string[]

Ein Array von möglichen dominanten Farben.

isBWImg

boolean

Ein Wert, der angibt, ob das Bild schwarzweiß ist.

ComputerVisionError

Details zum API-Anforderungsfehler.

Name Typ Beschreibung
code

ComputerVisionErrorCodes

Der Fehlercode.

message

string

Eine Meldung, die den vom Dienst gemeldeten Fehler erklärt.

requestId

string

Ein eindeutiger Anforderungsbezeichner.

ComputerVisionErrorCodes

Der Fehlercode.

Name Typ Beschreibung
BadArgument

string

CancelledRequest

string

DetectFaceError

string

FailedToProcess

string

InternalServerError

string

InvalidDetails

string

InvalidImageFormat

string

InvalidImageSize

string

InvalidImageUrl

string

InvalidModel

string

InvalidThumbnailSize

string

NotSupportedFeature

string

NotSupportedImage

string

NotSupportedLanguage

string

NotSupportedVisualFeature

string

StorageException

string

Timeout

string

Unspecified

string

UnsupportedMediaType

string

DescriptionExclude

Deaktivieren Sie die angegebenen Domänenmodelle beim Generieren der Beschreibung.

Name Typ Beschreibung
Celebrities

string

Landmarks

string

Details

Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Prominente - identifiziert Prominente, wenn sie im Bild erkannt werden, Wahrzeichen - identifiziert bemerkenswerte Sehenswürdigkeiten im Bild.

Name Typ Beschreibung
Celebrities

string

Landmarks

string

DetectedBrand

Eine Marke, die in einem Bild erkannt wurde.

Name Typ Beschreibung
confidence

number

Konfidenzbewertung der Marke im Bild als Wert zwischen 0 und 1.

name

string

Bezeichnung für die Marke.

rectangle

BoundingRect

Ungefähre Position der erkannten Marke.

DetectedObject

Ein in einem Bild erkanntes Objekt.

Name Typ Beschreibung
confidence

number

Konfidenzbewertung des Objekts im Bild als Wert zwischen 0 und 1.

object

string

Bezeichnung für das Objekt.

parent

ObjectHierarchy

Das übergeordnete Objekt aus Taxonomiesicht. Das übergeordnete Objekt ist eine generischere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben.

rectangle

BoundingRect

Ungefähre Position des erkannten Objekts.

FaceDescription

Ein Objekt, das eine im Bild identifizierte Gesichtserkennung beschreibt.

Name Typ Beschreibung
age

integer

Mögliches Alter des Gesichts.

faceRectangle

FaceRectangle

Rechteck im Bild, das das identifizierte Gesicht enthält.

gender

Gender

Mögliches Geschlecht des Gesichts.

FaceRectangle

Ein Objekt, das das Gesichtsrechteck beschreibt.

Name Typ Beschreibung
height

integer

Höhe, gemessen vom oberen linken Punkt des Gesichts in Pixel.

left

integer

X-Koordinate des oberen linken Punkts des Gesichts in Pixeln.

top

integer

Y-Koordinate des oberen linken Punkts des Gesichts in Pixel.

width

integer

Breite, gemessen vom linken oberen Punkt des Gesichts in Pixel.

Gender

Mögliches Geschlecht des Gesichts.

Name Typ Beschreibung
Female

string

Male

string

ImageAnalysis

Ergebnis des AnalyzeImage-Vorgangs.

Name Typ Beschreibung
adult

AdultInfo

Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder gleich ist.

brands

DetectedBrand[]

Array von Marken, die im Bild erkannt wurden.

categories

Category[]

Ein Array, das identifizierte Kategorien angibt.

color

ColorInfo

Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.

description

ImageDescriptionDetails

Eine Sammlung von Inhaltstags zusammen mit einer Liste von Untertiteln, die nach Konfidenzniveau und Bildmetadaten sortiert sind.

faces

FaceDescription[]

Ein Array möglicher Gesichter innerhalb des Bilds.

imageType

ImageType

Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.

metadata

ImageMetadata

Bildmetadaten.

objects

DetectedObject[]

Array von Objekten, die beschreiben, was im Bild erkannt wurde.

requestId

string

ID der REST-API-Anforderung.

tags

ImageTag[]

Eine Liste von Tags mit Konfidenzniveau.

ImageCaption

Ein Bild Untertitel, d.h. eine kurze Beschreibung des Bildes.

Name Typ Beschreibung
confidence

number

Das Maß an Vertrauen, das der Dienst in der Untertitel hat.

text

string

Der Text des Untertitel.

ImageDescriptionDetails

Eine Sammlung von Inhaltstags zusammen mit einer Liste von Untertiteln, die nach Konfidenzniveau und Bildmetadaten sortiert sind.

Name Typ Beschreibung
captions

ImageCaption[]

Eine Liste von Untertiteln, sortiert nach Konfidenzniveau.

tags

string[]

Eine Auflistung von Bildtags.

ImageMetadata

Bildmetadaten.

Name Typ Beschreibung
format

string

Bildformat.

height

integer

Bildhöhe in Pixel.

width

integer

Bildbreite in Pixel.

ImageTag

Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung.

Name Typ Beschreibung
confidence

number

Das Maß an Vertrauen, das die Entität beobachtet hat.

hint

string

Optionale Hinweise/Details für dieses Tag.

name

string

Name der Entität.

ImageType

Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.

Name Typ Beschreibung
clipArtType

integer

Konfidenzstufe, dass es sich bei dem Bild um eine Clipart handelt.

lineDrawingType

integer

Konfidenzstufe, dass es sich bei dem Bild um eine Linienzeichnung handelt.

ImageUrl

Name Typ Beschreibung
url

string

Öffentlich zugängliche URL eines Bilds.

LandmarksModel

Ein im Bild erkanntes Wahrzeichen.

Name Typ Beschreibung
confidence

number

Konfidenzstufe für die Orientierungserkennung als Wert von 0 bis 1.

name

string

Name des Wahrzeichens.

ObjectHierarchy

Ein Objekt, das in einem Bild erkannt wurde.

Name Typ Beschreibung
confidence

number

Konfidenzwert, der das Objekt im Bild als Wert von 0 bis 1 beobachtet hat.

object

string

Bezeichnung für das Objekt.

parent

ObjectHierarchy

Das übergeordnete Objekt aus Taxonomiesicht. Das übergeordnete Objekt ist eine allgemeinere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben.

VisualFeatureTypes

Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Kategorien : Kategorisiert Bildinhalte gemäß einer in der Dokumentation definierten Taxonomie. Tags: Markiert das Bild mit einer detaillierten Liste von Wörtern, die sich auf den Bildinhalt beziehen. Description: Beschreibt den Bildinhalt mit einem vollständigen Satz. Gesichter: Erkennt, ob Gesichter vorhanden sind. Wenn Gesichter vorhanden sind, generiert dieses Merkmal Informationen zu Koordinaten, Geschlecht und Alter. ImageType: Erkennt, ob das Bild eine pixelbasierte Rastergrafik oder eine linienbasierte Vektorgrafik ist. Farbe: Bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsener - erkennt, ob das Bild pornografischer Natur ist (zeigt Nacktheit oder einen Sexualakt), oder ist gory (zeigt extreme Gewalt oder Blut). Zweideutige und freizügige Inhalte werden ebenfalls erkannt. Objekte: Erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken: Erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Brands-Argument ist nur für Englisch verfügbar.

Name Typ Beschreibung
Adult

string

Brands

string

Categories

string

Color

string

Description

string

Faces

string

ImageType

string

Objects

string

Tags

string