Analyze Image - Analyze Image

Referenz

Dienst:: Azure AI Services

API-Version:: 3.1

Durch diesen Vorgang wird ein umfangreicher Satz von Visualfeatures basierend auf dem Bildinhalt extrahiert. Zwei Eingabemethoden werden unterstützt: (1) Hochladen eines Bilds oder (2) Angeben einer Bild-URL. In Ihrer Anforderung gibt es einen optionalen Parameter, mit dem Sie auswählen können, welche Features zurückgegeben werden sollen. Standardmäßig werden Bildkategorien in der Antwort zurückgegeben. Eine erfolgreiche Antwort wird in JSON zurückgegeben. Wenn die Anforderung fehlgeschlagen ist, enthält die Antwort einen Fehlercode und eine Meldung, um zu verstehen, was falsch gelaufen ist.

POST {Endpoint}/vision/v3.1/analyze

Mit optionalen Parametern:

POST {Endpoint}/vision/v3.1/analyze?visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
Endpoint	path	True	string	Unterstützte Cognitive Services-Endpunkte.
descriptionExclude	query		DescriptionExclude[]	Deaktivieren Sie die angegebenen Domänenmodelle beim Generieren der Beschreibung.
details	query		Details[]	Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt werden. Gültige visuelle Featuretypen sind: Prominente – identifiziert Prominente, wenn sie im Bild erkannt werden, Wahrzeichen – identifiziert wichtige Sehenswürdigkeiten im Bild.
language	query		string	Die gewünschte Sprache für die Ausgabegenerierung. Wenn dieser Parameter nicht angegeben ist, lautet der Standardwert "en". Unterstützte Sprachen:en - Englisch, Standard. es - Spanisch, ja - Japanisch, pt - Portugiesisch, zh - Vereinfachtes Chinesisch.
visualFeatures	query		VisualFeatureTypes[]	Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt werden. Gültige visuelle Featuretypen umfassen: Kategorien : Kategorisiert Bildinhalte gemäß einer in der Dokumentation definierten Taxonomie. Tags: Markiert das Bild mit einer detaillierten Liste von Wörtern im Zusammenhang mit dem Bildinhalt. Description: Beschreibt den Bildinhalt mit einem vollständigen Satz. Gesichter: Erkennt, ob Gesichter vorhanden sind. Wenn Gesichter vorhanden sind, generiert dieses Merkmal Informationen zu Koordinaten, Geschlecht und Alter. ImageType: Erkennt, ob das Bild eine pixelbasierte Rastergrafik oder eine linienbasierte Vektorgrafik ist. Farbe: Bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsener - erkennt, ob das Bild pornografischer Natur ist (zeigt Nacktheit oder einen Sexualakt) oder ist gory (zeigt extreme Gewalt oder Blut). Zweideutige und freizügige Inhalte werden ebenfalls erkannt. Objekte: Erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken : Erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Brands-Argument ist nur für Englisch verfügbar.

Anforderungsheader

Name	Erforderlich	Typ	Beschreibung
Ocp-Apim-Subscription-Key	True	string

Anforderungstext

Name	Erforderlich	Typ	Beschreibung
url	True	string	Öffentlich erreichbare URL eines Bilds.

Antworten

Name	Typ	Beschreibung
200 OK	ImageAnalysis	Die Antwort enthält die extrahierten Features im JSON-Format. Hier sehen Sie die Definitionen für Enumerationstypen: ClipartType Nicht - clipart = 0, mehrdeutig = 1, normal - clipart = 2, good - clipart = 3. LineDrawingTypeNon – LineDrawing = 0, LineDrawing = 1.
Other Status Codes	ComputerVisionError	Fehlerantwort.

Name

Typ

Beschreibung

200 OK

ImageAnalysis

Die Antwort enthält die extrahierten Features im JSON-Format. Hier sehen Sie die Definitionen für Enumerationstypen:

ClipartType

Nicht - clipart = 0, mehrdeutig = 1, normal - clipart = 2, good - clipart = 3. LineDrawingTypeNon – LineDrawing = 0, LineDrawing = 1.

Other Status Codes

ComputerVisionError

Fehlerantwort.

Sicherheit

Ocp-Apim-Subscription-Key

Typ: apiKey
In: header

Beispiele

Successful AnalyzeImage request

Beispielanforderung

HTTP

POST https://westus.api.cognitive.microsoft.com/vision/v3.1/analyze?visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en


{
  "url": "{url}"
}

Beispiel für eine Antwort

Statuscode:: 200

{
  "categories": [
    {
      "name": "abstract_",
      "score": 0.00390625
    },
    {
      "name": "people_",
      "score": 0.83984375,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 597,
              "top": 162,
              "width": 248,
              "height": 248
            },
            "confidence": 0.999028444
          }
        ]
      }
    },
    {
      "name": "building_",
      "score": 0.984375,
      "detail": {
        "landmarks": [
          {
            "name": "Forbidden City",
            "confidence": 0.9829016923904419
          }
        ]
      }
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isRacyContent": false,
    "isGoryContent": false,
    "adultScore": 0.0934349000453949,
    "racyScore": 0.06861349195241928,
    "goreScore": 0.012872257380997575
  },
  "tags": [
    {
      "name": "person",
      "confidence": 0.9897908568382263
    },
    {
      "name": "man",
      "confidence": 0.9449388980865479
    },
    {
      "name": "outdoor",
      "confidence": 0.938492476940155
    },
    {
      "name": "window",
      "confidence": 0.8951393961906433
    },
    {
      "name": "pangolin",
      "confidence": 0.7250059783791661,
      "hint": "mammal"
    }
  ],
  "description": {
    "tags": [
      "person",
      "man",
      "outdoor",
      "window",
      "glasses"
    ],
    "captions": [
      {
        "text": "Satya Nadella sitting on a bench",
        "confidence": 0.48293603002174407
      }
    ]
  },
  "requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
  "metadata": {
    "width": 1500,
    "height": 1000,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 44,
      "gender": "Male",
      "faceRectangle": {
        "left": 593,
        "top": 160,
        "width": 250,
        "height": 250
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Brown",
    "dominantColorBackground": "Brown",
    "dominantColors": [
      "Brown",
      "Black"
    ],
    "accentColor": "873B59",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "objects": [
    {
      "rectangle": {
        "x": 0,
        "y": 0,
        "w": 50,
        "h": 50
      },
      "object": "tree",
      "confidence": 0.9,
      "parent": {
        "object": "plant",
        "confidence": 0.95
      }
    }
  ],
  "brands": [
    {
      "name": "Pepsi",
      "confidence": 0.857,
      "rectangle": {
        "x": 489,
        "y": 79,
        "w": 161,
        "h": 177
      }
    },
    {
      "name": "Coca-Cola",
      "confidence": 0.893,
      "rectangle": {
        "x": 216,
        "y": 55,
        "w": 171,
        "h": 372
      }
    }
  ]
}

Definitionen

Name	Beschreibung
AdultInfo	Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder gleich ist.
BoundingRect	Ein Begrenzungsrahmen für einen Bereich innerhalb eines Bilds.
Category	Ein Objekt, das die identifizierte Kategorie beschreibt.
CategoryDetail	Ein Objekt, das zusätzliche Kategoriedetails beschreibt.
CelebritiesModel	Ein Objekt, das eine mögliche Prominentenidentifikation beschreibt.
ColorInfo	Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.
ComputerVisionError	Details zum API-Anforderungsfehler.
ComputerVisionErrorCodes	Der Fehlercode.
DescriptionExclude	Deaktivieren Sie die angegebenen Domänenmodelle beim Generieren der Beschreibung.
Details	Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Prominente - identifiziert Prominente, wenn sie im Bild erkannt werden, Wahrzeichen - identifiziert bemerkenswerte Sehenswürdigkeiten im Bild.
DetectedBrand	Eine Marke, die in einem Bild erkannt wurde.
DetectedObject	Ein in einem Bild erkanntes Objekt.
FaceDescription	Ein Objekt, das eine im Bild identifizierte Gesichtserkennung beschreibt.
FaceRectangle	Ein Objekt, das das Gesichtsrechteck beschreibt.
Gender	Mögliches Geschlecht des Gesichts.
ImageAnalysis	Ergebnis des AnalyzeImage-Vorgangs.
ImageCaption	Ein Bild Untertitel, d.h. eine kurze Beschreibung des Bildes.
ImageDescriptionDetails	Eine Sammlung von Inhaltstags zusammen mit einer Liste von Untertiteln, die nach Konfidenzniveau und Bildmetadaten sortiert sind.
ImageMetadata	Bildmetadaten.
ImageTag	Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung.
ImageType	Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.
ImageUrl
LandmarksModel	Ein im Bild erkanntes Wahrzeichen.
ObjectHierarchy	Ein Objekt, das in einem Bild erkannt wurde.
VisualFeatureTypes	Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Kategorien : Kategorisiert Bildinhalte gemäß einer in der Dokumentation definierten Taxonomie. Tags: Markiert das Bild mit einer detaillierten Liste von Wörtern, die sich auf den Bildinhalt beziehen. Description: Beschreibt den Bildinhalt mit einem vollständigen Satz. Gesichter: Erkennt, ob Gesichter vorhanden sind. Wenn Gesichter vorhanden sind, generiert dieses Merkmal Informationen zu Koordinaten, Geschlecht und Alter. ImageType: Erkennt, ob das Bild eine pixelbasierte Rastergrafik oder eine linienbasierte Vektorgrafik ist. Farbe: Bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsener - erkennt, ob das Bild pornografischer Natur ist (zeigt Nacktheit oder einen Sexualakt), oder ist gory (zeigt extreme Gewalt oder Blut). Zweideutige und freizügige Inhalte werden ebenfalls erkannt. Objekte: Erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken: Erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Brands-Argument ist nur für Englisch verfügbar.

AdultInfo

Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder gleich ist.

Name	Typ	Beschreibung
adultScore	number	Bewertung von 0 bis 1, die angibt, wie sehr der Inhalt innerhalb des Bilds als erwachsenenorientiert betrachtet wird.
goreScore	number	Eine Bewertung von 0 bis 1, die angibt, wie das Bild gory ist.
isAdultContent	boolean	Ein Wert, der angibt, ob das Bild inhalte für erwachsene Benutzer enthält.
isGoryContent	boolean	Ein Wert, der angibt, ob das Bild gory ist.
isRacyContent	boolean	Ein Wert, der angibt, ob das Bild gleich ist.
racyScore	number	Bewertung von 0 bis 1, die angibt, wie suggestiv das Bild ist.

BoundingRect

Ein Begrenzungsrahmen für einen Bereich innerhalb eines Bilds.

Name	Typ	Beschreibung
h	integer	Gemessene Höhe des linken oberen Punkts des Bereichs, in Pixeln.
w	integer	Gemessene Breite des linken oberen Punkts des Bereichs, in Pixeln.
x	integer	X-Koordinate des oberen linken Punkts des Bereichs in Pixel.
y	integer	Y-Koordinate des oberen linken Punkts des Bereichs in Pixeln.

Name	Typ	Beschreibung
detail	CategoryDetail	Details der identifizierten Kategorie.
name	string	Name der Kategorie
score	number	Bewertung der Kategorie.

CategoryDetail

Ein Objekt, das zusätzliche Kategoriedetails beschreibt.

Name	Typ	Beschreibung
celebrities	CelebritiesModel[]	Eine Reihe von Prominenten, falls vorhanden.
landmarks	LandmarksModel[]	Ein Array von Orientierungspunkten, falls vorhanden.

CelebritiesModel

Ein Objekt, das eine mögliche Prominentenidentifikation beschreibt.

Name	Typ	Beschreibung
confidence	number	Konfidenzstufe für die Prominentenerkennung als Wert von 0 bis 1.
faceRectangle	FaceRectangle	Position des identifizierten Gesichts im Bild.
name	string	Name des Prominenten.

ColorInfo

Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.

Name	Typ	Beschreibung
accentColor	string	Mögliche Akzentfarbe.
dominantColorBackground	string	Mögliche dominante Hintergrundfarbe.
dominantColorForeground	string	Mögliche dominante Vordergrundfarbe.
dominantColors	string[]	Ein Array von möglichen dominanten Farben.
isBWImg	boolean	Ein Wert, der angibt, ob das Bild schwarzweiß ist.

ComputerVisionError

Details zum API-Anforderungsfehler.

Name	Typ	Beschreibung
code	ComputerVisionErrorCodes	Der Fehlercode.
message	string	Eine Meldung, die den vom Dienst gemeldeten Fehler erklärt.
requestId	string	Ein eindeutiger Anforderungsbezeichner.

ComputerVisionErrorCodes

Der Fehlercode.

Name	Typ	Beschreibung
BadArgument	string
CancelledRequest	string
DetectFaceError	string
FailedToProcess	string
InternalServerError	string
InvalidDetails	string
InvalidImageFormat	string
InvalidImageSize	string
InvalidImageUrl	string
InvalidModel	string
InvalidThumbnailSize	string
NotSupportedFeature	string
NotSupportedImage	string
NotSupportedLanguage	string
NotSupportedVisualFeature	string
StorageException	string
Timeout	string
Unspecified	string
UnsupportedMediaType	string

DescriptionExclude

Deaktivieren Sie die angegebenen Domänenmodelle beim Generieren der Beschreibung.

Name	Typ	Beschreibung
Celebrities	string
Landmarks	string

Details

Eine Zeichenfolge, die angibt, welche domänenspezifischen Details zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Prominente - identifiziert Prominente, wenn sie im Bild erkannt werden, Wahrzeichen - identifiziert bemerkenswerte Sehenswürdigkeiten im Bild.

Name	Typ	Beschreibung
Celebrities	string
Landmarks	string

DetectedBrand

Eine Marke, die in einem Bild erkannt wurde.

Name	Typ	Beschreibung
confidence	number	Konfidenzbewertung der Marke im Bild als Wert zwischen 0 und 1.
name	string	Bezeichnung für die Marke.
rectangle	BoundingRect	Ungefähre Position der erkannten Marke.

DetectedObject

Ein in einem Bild erkanntes Objekt.

Name	Typ	Beschreibung
confidence	number	Konfidenzbewertung des Objekts im Bild als Wert zwischen 0 und 1.
object	string	Bezeichnung für das Objekt.
parent	ObjectHierarchy	Das übergeordnete Objekt aus Taxonomiesicht. Das übergeordnete Objekt ist eine generischere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben.
rectangle	BoundingRect	Ungefähre Position des erkannten Objekts.

FaceDescription

Ein Objekt, das eine im Bild identifizierte Gesichtserkennung beschreibt.

Name	Typ	Beschreibung
age	integer	Mögliches Alter des Gesichts.
faceRectangle	FaceRectangle	Rechteck im Bild, das das identifizierte Gesicht enthält.
gender	Gender	Mögliches Geschlecht des Gesichts.

FaceRectangle

Ein Objekt, das das Gesichtsrechteck beschreibt.

Name	Typ	Beschreibung
height	integer	Höhe, gemessen vom oberen linken Punkt des Gesichts in Pixel.
left	integer	X-Koordinate des oberen linken Punkts des Gesichts in Pixeln.
top	integer	Y-Koordinate des oberen linken Punkts des Gesichts in Pixel.
width	integer	Breite, gemessen vom linken oberen Punkt des Gesichts in Pixel.

Gender

Mögliches Geschlecht des Gesichts.

Name	Typ	Beschreibung
Female	string
Male	string

ImageAnalysis

Ergebnis des AnalyzeImage-Vorgangs.

Name	Typ	Beschreibung
adult	AdultInfo	Ein Objekt, das beschreibt, ob das Bild erwachsene Inhalte enthält und/oder gleich ist.
brands	DetectedBrand[]	Array von Marken, die im Bild erkannt wurden.
categories	Category[]	Ein Array, das identifizierte Kategorien angibt.
color	ColorInfo	Ein Objekt, das zusätzliche Metadaten zur Beschreibung von Farbattributen bereitstellt.
description	ImageDescriptionDetails	Eine Sammlung von Inhaltstags zusammen mit einer Liste von Untertiteln, die nach Konfidenzniveau und Bildmetadaten sortiert sind.
faces	FaceDescription[]	Ein Array möglicher Gesichter innerhalb des Bilds.
imageType	ImageType	Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.
metadata	ImageMetadata	Bildmetadaten.
objects	DetectedObject[]	Array von Objekten, die beschreiben, was im Bild erkannt wurde.
requestId	string	ID der REST-API-Anforderung.
tags	ImageTag[]	Eine Liste von Tags mit Konfidenzniveau.

ImageCaption

Ein Bild Untertitel, d.h. eine kurze Beschreibung des Bildes.

Name	Typ	Beschreibung
confidence	number	Das Maß an Vertrauen, das der Dienst in der Untertitel hat.
text	string	Der Text des Untertitel.

ImageDescriptionDetails

Eine Sammlung von Inhaltstags zusammen mit einer Liste von Untertiteln, die nach Konfidenzniveau und Bildmetadaten sortiert sind.

Name	Typ	Beschreibung
captions	ImageCaption[]	Eine Liste von Untertiteln, sortiert nach Konfidenzniveau.
tags	string[]	Eine Auflistung von Bildtags.

ImageMetadata

Bildmetadaten.

Name	Typ	Beschreibung
format	string	Bildformat.
height	integer	Bildhöhe in Pixel.
width	integer	Bildbreite in Pixel.

ImageTag

Eine Entitätsbeobachtung im Bild zusammen mit der Konfidenzbewertung.

Name	Typ	Beschreibung
confidence	number	Das Maß an Vertrauen, das die Entität beobachtet hat.
hint	string	Optionale Hinweise/Details für dieses Tag.
name	string	Name der Entität.

ImageType

Ein Objekt, das mögliche Bildtypen und übereinstimmende Konfidenzstufen bereitstellt.

Name	Typ	Beschreibung
clipArtType	integer	Konfidenzstufe, dass es sich bei dem Bild um eine Clipart handelt.
lineDrawingType	integer	Konfidenzstufe, dass es sich bei dem Bild um eine Linienzeichnung handelt.

ImageUrl

Name	Typ	Beschreibung
url	string	Öffentlich zugängliche URL eines Bilds.

LandmarksModel

Ein im Bild erkanntes Wahrzeichen.

Name	Typ	Beschreibung
confidence	number	Konfidenzstufe für die Orientierungserkennung als Wert von 0 bis 1.
name	string	Name des Wahrzeichens.

ObjectHierarchy

Ein Objekt, das in einem Bild erkannt wurde.

Name	Typ	Beschreibung
confidence	number	Konfidenzwert, der das Objekt im Bild als Wert von 0 bis 1 beobachtet hat.
object	string	Bezeichnung für das Objekt.
parent	ObjectHierarchy	Das übergeordnete Objekt aus Taxonomiesicht. Das übergeordnete Objekt ist eine allgemeinere Form dieses Objekts. Beispielsweise würde ein "Bulldog" ein Elternteil von "Hund" haben.

VisualFeatureTypes

Eine Zeichenfolge, die angibt, welche visuellen Featuretypen zurückgegeben werden sollen. Mehrere Werte sollten durch Trennzeichen getrennt sein. Gültige visuelle Featuretypen umfassen: Kategorien : Kategorisiert Bildinhalte gemäß einer in der Dokumentation definierten Taxonomie. Tags: Markiert das Bild mit einer detaillierten Liste von Wörtern, die sich auf den Bildinhalt beziehen. Description: Beschreibt den Bildinhalt mit einem vollständigen Satz. Gesichter: Erkennt, ob Gesichter vorhanden sind. Wenn Gesichter vorhanden sind, generiert dieses Merkmal Informationen zu Koordinaten, Geschlecht und Alter. ImageType: Erkennt, ob das Bild eine pixelbasierte Rastergrafik oder eine linienbasierte Vektorgrafik ist. Farbe: Bestimmt die Akzentfarbe, die dominante Farbe und ob ein Bild schwarz&Weiß ist. Erwachsener - erkennt, ob das Bild pornografischer Natur ist (zeigt Nacktheit oder einen Sexualakt), oder ist gory (zeigt extreme Gewalt oder Blut). Zweideutige und freizügige Inhalte werden ebenfalls erkannt. Objekte: Erkennt verschiedene Objekte innerhalb eines Bilds, einschließlich der ungefähren Position. Das Objects-Argument ist nur für Englisch verfügbar. Marken: Erkennt verschiedene Marken innerhalb eines Bilds, einschließlich der ungefähren Position. Das Brands-Argument ist nur für Englisch verfügbar.

Name	Typ	Beschreibung
Adult	string
Brands	string
Categories	string
Color	string
Description	string
Faces	string
ImageType	string
Objects	string
Tags	string

Freigeben über

Analyze Image - Analyze Image

URI-Parameter

Anforderungsheader

Anforderungstext

Antworten

Sicherheit

Ocp-Apim-Subscription-Key

Beispiele

Successful AnalyzeImage request

Beispielanforderung

Beispiel für eine Antwort

Definitionen

AdultInfo

BoundingRect

Category

CategoryDetail

CelebritiesModel

ColorInfo

ComputerVisionError

ComputerVisionErrorCodes

DescriptionExclude

Details

DetectedBrand

DetectedObject

FaceDescription

FaceRectangle

Gender

ImageAnalysis

ImageCaption

ImageDescriptionDetails

ImageMetadata

ImageTag

ImageType

ImageUrl

LandmarksModel

ObjectHierarchy

VisualFeatureTypes

Zusätzliche Ressourcen