Analyze Image - Analyze Image

リファレンス

Service:: Cognitive Services - Computer Vision

API Version:: 3.1

この操作では､画像の内容に基づいて、さまざまな視覚的特徴のセットを抽出できます。 2 つの入力方法がサポートされています。(1) イメージのアップロードまたは (2) イメージ URL の指定。要求内には、返す機能を選択できる省略可能なパラメーターがあります。既定では、画像カテゴリは応答で返されます。成功した応答は JSON で返されます。要求が失敗した場合、応答にはエラーコードと、何が問題が発生したかを理解するのに役立つメッセージが含まれます。

POST {Endpoint}/vision/v3.1/analyze

With optional parameters:

POST {Endpoint}/vision/v3.1/analyze?visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}

URI パラメーター

名前	/	必須	型	説明
Endpoint	path	True	string	サポートされている Cognitive Services エンドポイント。
descriptionExclude	query		DescriptionExclude[]	説明を生成するときに、指定したドメインモデルをオフにします。
details	query		Details[]	返すドメイン固有の詳細を示す文字列。複数の値をコンマ区切りにする必要があります。有効なビジュアル機能の種類には、著名人 - 画像で検出された場合は有名人を識別し、ランドマークはイメージ内の注目すべきランドマークを識別します。
language	query		string	出力生成に必要な言語。このパラメーターを指定しない場合、既定値は "en" です。サポートされている言語:en - 英語、既定値。 es - スペイン語、ja - 日本語、pt - ポルトガル語、zh - 簡体字中国語。
visualFeatures	query		VisualFeatureTypes[]	返すビジュアル機能の種類を示す文字列。複数の値をコンマ区切りにする必要があります。有効なビジュアル機能の種類は次のとおりです。カテゴリ - ドキュメントで定義されている分類に従って画像コンテンツを分類します。タグ - 画像のコンテンツに関連する単語の詳細な一覧で画像にタグを付けます。 Description - 英文でのイメージのコンテンツの説明です｡顔 - 顔が存在するかどうかを検出します。存在する場合は、座標、性別、および年齢を生成します。 ImageType - イメージがクリップアートか線画かを検出します｡ [色] - アクセントの色、優先色、イメージが黒&白かどうかを決定します。成人 - 画像が本質的にポルノ(ヌードや性行為を表す)、またはゴーリー(極端な暴力や血液を示す)であるかどうかを検出します。性的な暗示を含むコンテンツ (わいせつコンテンツ) も検出されます。オブジェクト - おおよその位置など、画像内のさまざまなオブジェクトを検出します。 Objects 引数は、英語でのみ使用できます。 [ブランド] - おおよその場所など、画像内のさまざまなブランドを検出します。 Brands 引数は、英語でのみ使用できます。

要求ヘッダー

名前	必須	型	説明
Ocp-Apim-Subscription-Key	True	string

要求本文

名前	必須	型	説明
url	True	string	イメージのパブリックに到達可能な URL。

応答

名前	型	説明
200 OK	ImageAnalysis	応答には、JSON 形式で抽出された機能が含まれます。列挙型の定義を次に示します。 ClipartType 非 - クリップアート = 0、あいまい = 1、標準 - クリップアート = 2、良好 - クリップアート = 3。 LineDrawingTypeNon - LineDrawing = 0、LineDrawing = 1。
Other Status Codes	ComputerVisionError	エラー応答。

名前

型

説明

200 OK

ImageAnalysis

応答には、JSON 形式で抽出された機能が含まれます。列挙型の定義を次に示します。

ClipartType

非 - クリップアート = 0、あいまい = 1、標準 - クリップアート = 2、良好 - クリップアート = 3。 LineDrawingTypeNon - LineDrawing = 0、LineDrawing = 1。

Other Status Codes

ComputerVisionError

エラー応答。

セキュリティ

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

例

Successful AnalyzeImage request

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/vision/v3.1/analyze?visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en


{
  "url": "{url}"
}

Sample Response

Status code:: 200

{
  "categories": [
    {
      "name": "abstract_",
      "score": 0.00390625
    },
    {
      "name": "people_",
      "score": 0.83984375,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 597,
              "top": 162,
              "width": 248,
              "height": 248
            },
            "confidence": 0.999028444
          }
        ]
      }
    },
    {
      "name": "building_",
      "score": 0.984375,
      "detail": {
        "landmarks": [
          {
            "name": "Forbidden City",
            "confidence": 0.9829016923904419
          }
        ]
      }
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isRacyContent": false,
    "isGoryContent": false,
    "adultScore": 0.0934349000453949,
    "racyScore": 0.06861349195241928,
    "goreScore": 0.012872257380997575
  },
  "tags": [
    {
      "name": "person",
      "confidence": 0.9897908568382263
    },
    {
      "name": "man",
      "confidence": 0.9449388980865479
    },
    {
      "name": "outdoor",
      "confidence": 0.938492476940155
    },
    {
      "name": "window",
      "confidence": 0.8951393961906433
    },
    {
      "name": "pangolin",
      "confidence": 0.7250059783791661,
      "hint": "mammal"
    }
  ],
  "description": {
    "tags": [
      "person",
      "man",
      "outdoor",
      "window",
      "glasses"
    ],
    "captions": [
      {
        "text": "Satya Nadella sitting on a bench",
        "confidence": 0.48293603002174407
      }
    ]
  },
  "requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
  "metadata": {
    "width": 1500,
    "height": 1000,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 44,
      "gender": "Male",
      "faceRectangle": {
        "left": 593,
        "top": 160,
        "width": 250,
        "height": 250
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Brown",
    "dominantColorBackground": "Brown",
    "dominantColors": [
      "Brown",
      "Black"
    ],
    "accentColor": "873B59",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "objects": [
    {
      "rectangle": {
        "x": 0,
        "y": 0,
        "w": 50,
        "h": 50
      },
      "object": "tree",
      "confidence": 0.9,
      "parent": {
        "object": "plant",
        "confidence": 0.95
      }
    }
  ],
  "brands": [
    {
      "name": "Pepsi",
      "confidence": 0.857,
      "rectangle": {
        "x": 489,
        "y": 79,
        "w": 161,
        "h": 177
      }
    },
    {
      "name": "Coca-Cola",
      "confidence": 0.893,
      "rectangle": {
        "x": 216,
        "y": 55,
        "w": 171,
        "h": 372
      }
    }
  ]
}

定義

名前	説明
AdultInfo	画像に成人向けコンテンツが含まれているか、わいせつであるかを示すオブジェクト。
BoundingRect	画像内の領域の境界ボックス。
Category	識別されたカテゴリを記述するオブジェクト。
CategoryDetail	追加のカテゴリの詳細を記述するオブジェクト。
CelebritiesModel	著名人識別の可能性を記述するオブジェクト。
ColorInfo	色属性を記述する追加のメタデータを提供するオブジェクト。
ComputerVisionError	API 要求エラーの詳細。
ComputerVisionErrorCodes	エラーコード。
DescriptionExclude	説明を生成するときに、指定したドメインモデルをオフにします。
Details	返すドメイン固有の詳細を示す文字列。複数の値をコンマ区切りにする必要があります。有効なビジュアル機能の種類は次のとおりです。 [有名人] - 画像で検出された場合は有名人を識別し、ランドマークは画像内の注目すべきランドマークを識別します。
DetectedBrand	画像で検出されたブランド。
DetectedObject	イメージで検出されたオブジェクト。
FaceDescription	画像内で識別される顔を記述するオブジェクト。
FaceRectangle	面の四角形を記述するオブジェクト。
Gender	顔の可能性のある性別。
ImageAnalysis	AnalyzeImage 操作の結果。
ImageCaption	画像キャプション。つまり、画像が示す内容の簡単な説明です。
ImageDescriptionDetails	コンテンツタグのコレクションと、信頼度レベルで並べ替えられたキャプションの一覧、および画像メタデータ。
ImageMetadata	画像メタデータ。
ImageTag	画像内のエンティティ観察と信頼度スコア。
ImageType	可能なイメージの種類と一致する信頼度レベルを提供するオブジェクト。
ImageUrl
LandmarksModel	画像内で認識されるランドマーク。
ObjectHierarchy	イメージ内で検出されたオブジェクト。
VisualFeatureTypes	返すビジュアル機能の種類を示す文字列。複数の値をコンマ区切りにする必要があります。有効なビジュアル機能の種類には、カテゴリが含まれます。画像コンテンツは、ドキュメントで定義されている分類に従って分類されます。タグ - 画像の内容に関連する単語の詳細な一覧で画像にタグを付けます。 Description - 英文でのイメージのコンテンツの説明です｡顔 - 顔が存在するかどうかを検出します。存在する場合は、座標、性別、および年齢を生成します。 ImageType - イメージがクリップアートか線画かを検出します｡ [色] - アクセントの色、優勢な色、イメージが黒&白かどうかを決定します。成人 - 画像が本質的にポルノ的なもの (ヌードや性行為を示す)、またはゴーリー (極端な暴力や血液を示す) かどうかを検出します。性的な暗示を含むコンテンツ (わいせつコンテンツ) も検出されます。オブジェクト - 画像内のさまざまなオブジェクト (おおよその位置を含む) を検出します。 Objects 引数は、英語でのみ使用できます。ブランド - 画像内のさまざまなブランド (おおよその場所を含む) を検出します。 Brands 引数は、英語でのみ使用できます。

AdultInfo

画像に成人向けコンテンツが含まれているか、わいせつであるかを示すオブジェクト。

名前	型	説明
adultScore	number	画像内で成人向けと見なされるコンテンツの量を示す 0 から 1 までのスコア。
goreScore	number	0 から 1 のスコアを付けて、画像のゴリーの様子を示します。
isAdultContent	boolean	画像に成人向けコンテンツが含まれているかどうかを示す値。
isGoryContent	boolean	画像が gory かどうかを示す値。
isRacyContent	boolean	イメージがわいせつかどうかを示す値。
racyScore	number	画像がどの程度示唆されているかを示す 0 から 1 のスコアを付けます。

BoundingRect

画像内の領域の境界ボックス。

名前	型	説明
h	integer	領域の左上の点から計測された高さ (ピクセル単位)。
w	integer	領域の左上の点から計測された幅 (ピクセル単位)。
x	integer	領域の左上のポイントの X 座標 (ピクセル単位)。
y	integer	領域の左上の点の Y 座標 (ピクセル単位)。

名前	型	説明
detail	CategoryDetail	識別されたカテゴリの詳細。
name	string	カテゴリの名前。
score	number	カテゴリのスコアリング。

CategoryDetail

追加のカテゴリの詳細を記述するオブジェクト。

名前	型	説明
celebrities	CelebritiesModel[]	識別された場合は有名人の配列。
landmarks	LandmarksModel[]	ランドマークが特定された場合は、その配列。

CelebritiesModel

著名人識別の可能性を記述するオブジェクト。

名前	型	説明
confidence	number	0 ~ 1 の範囲の値としての有名人認識の信頼度レベル。
faceRectangle	FaceRectangle	画像内の識別された顔の場所。
name	string	有名人の名前。

ColorInfo

色属性を記述する追加のメタデータを提供するオブジェクト。

名前	型	説明
accentColor	string	可能なアクセントカラー。
dominantColorBackground	string	可能な優勢な背景色。
dominantColorForeground	string	可能な優勢な前景色。
dominantColors	string[]	可能な優勢な色の配列。
isBWImg	boolean	イメージが白黒かどうかを示す値。

ComputerVisionError

API 要求エラーの詳細。

名前	型	説明
code	ComputerVisionErrorCodes	エラーコード。
message	string	サービスによって報告されたエラーを説明するメッセージ。
requestId	string	一意の要求識別子。

ComputerVisionErrorCodes

エラーコード。

名前	型	説明
BadArgument	string
CancelledRequest	string
DetectFaceError	string
FailedToProcess	string
InternalServerError	string
InvalidDetails	string
InvalidImageFormat	string
InvalidImageSize	string
InvalidImageUrl	string
InvalidModel	string
InvalidThumbnailSize	string
NotSupportedFeature	string
NotSupportedImage	string
NotSupportedLanguage	string
NotSupportedVisualFeature	string
StorageException	string
Timeout	string
Unspecified	string
UnsupportedMediaType	string

DescriptionExclude

説明を生成するときに、指定したドメインモデルをオフにします。

名前	型	説明
Celebrities	string
Landmarks	string

Details

返すドメイン固有の詳細を示す文字列。複数の値をコンマ区切りにする必要があります。有効なビジュアル機能の種類は次のとおりです。 [有名人] - 画像で検出された場合は有名人を識別し、ランドマークは画像内の注目すべきランドマークを識別します。

名前	型	説明
Celebrities	string
Landmarks	string

DetectedBrand

画像で検出されたブランド。

名前	型	説明
confidence	number	画像内のブランドを観察したという信頼度スコアは、0から1の範囲の値として示される。
name	string	ブランドのラベル。
rectangle	BoundingRect	検出されたブランドのおおよその場所。

DetectedObject

イメージで検出されたオブジェクト。

名前	型	説明
confidence	number	画像内の物体を観察した信頼度スコアは、0から1の範囲の値として示される。
object	string	オブジェクトのラベル。
parent	ObjectHierarchy	分類の観点から見た親オブジェクト。親オブジェクトは、このオブジェクトのより汎用的な形式です。たとえば、"bulldog" には 'dog' の親が含まれます。
rectangle	BoundingRect	検出されたオブジェクトのおおよその位置。

FaceDescription

画像内で識別される顔を記述するオブジェクト。

名前	型	説明
age	integer	顔の可能な年齢。
faceRectangle	FaceRectangle	識別された顔を含む画像内の四角形。
gender	Gender	顔の可能性のある性別。

FaceRectangle

面の四角形を記述するオブジェクト。

名前	型	説明
height	integer	顔の左上のポイントから測定された高さ (ピクセル単位)。
left	integer	顔の左上点の X 座標 (ピクセル単位)。
top	integer	顔の左上の点の Y 座標 (ピクセル単位)。
width	integer	面の左上のポイントから測定された幅 (ピクセル単位)。

Gender

顔の可能性のある性別。

名前	型	説明
Female	string
Male	string

ImageAnalysis

AnalyzeImage 操作の結果。

名前	型	説明
adult	AdultInfo	画像に成人向けコンテンツが含まれているか、わいせつであるかを示すオブジェクト。
brands	DetectedBrand[]	画像で検出されたブランドの配列。
categories	Category[]	識別されたカテゴリを示す配列。
color	ColorInfo	色属性を記述する追加のメタデータを提供するオブジェクト。
description	ImageDescriptionDetails	コンテンツタグのコレクションと、信頼度レベルで並べ替えられたキャプションの一覧、および画像メタデータ。
faces	FaceDescription[]	画像内で使用可能な顔の配列。
imageType	ImageType	可能なイメージの種類と一致する信頼度レベルを提供するオブジェクト。
metadata	ImageMetadata	画像メタデータ。
objects	DetectedObject[]	画像で検出された内容を記述するオブジェクトの配列。
requestId	string	REST API 要求の ID。
tags	ImageTag[]	信頼度レベルを持つタグの一覧。

ImageCaption

画像キャプション。つまり、画像が示す内容の簡単な説明です。

名前	型	説明
confidence	number	サービスがキャプションに持つ信頼度。
text	string	キャプションのテキスト。

ImageDescriptionDetails

コンテンツタグのコレクションと、信頼度レベルで並べ替えられたキャプションの一覧、および画像メタデータ。

名前	型	説明
captions	ImageCaption[]	信頼度レベルで並べ替えられたキャプションの一覧。
tags	string[]	イメージタグのコレクション。

ImageMetadata

画像メタデータ。

名前	型	説明
format	string	イメージ形式。
height	integer	画像の高さ (ピクセル単位)。
width	integer	画像の幅 (ピクセル単位)。

ImageTag

画像内のエンティティ観察と信頼度スコア。

名前	型	説明
confidence	number	エンティティが観察された信頼度。
hint	string	このタグの省略可能なヒント/詳細。
name	string	エンティティの名前。

ImageType

可能なイメージの種類と一致する信頼度レベルを提供するオブジェクト。

名前	型	説明
clipArtType	integer	画像がクリップアートであるという信頼度。
lineDrawingType	integer	イメージが線画であることを示す信頼度レベル。

ImageUrl

名前	型	説明
url	string	イメージのパブリックに到達可能な URL。

LandmarksModel

画像内で認識されるランドマーク。

名前	型	説明
confidence	number	0 ~ 1 の範囲の値としてのランドマーク認識の信頼度レベル。
name	string	ランドマークの名前。

ObjectHierarchy

イメージ内で検出されたオブジェクト。

名前	型	説明
confidence	number	画像内の物体を観察した信頼度スコアは、0から1までの範囲の値として示される。
object	string	オブジェクトのラベル。
parent	ObjectHierarchy	分類の観点から見た親オブジェクト。親オブジェクトは、このオブジェクトのより汎用的な形式です。たとえば、"bulldog" には 'dog' の親が含まれます。

VisualFeatureTypes

返すビジュアル機能の種類を示す文字列。複数の値をコンマ区切りにする必要があります。有効なビジュアル機能の種類には、カテゴリが含まれます。画像コンテンツは、ドキュメントで定義されている分類に従って分類されます。タグ - 画像の内容に関連する単語の詳細な一覧で画像にタグを付けます。 Description - 英文でのイメージのコンテンツの説明です｡顔 - 顔が存在するかどうかを検出します。存在する場合は、座標、性別、および年齢を生成します。 ImageType - イメージがクリップアートか線画かを検出します｡ [色] - アクセントの色、優勢な色、イメージが黒&白かどうかを決定します。成人 - 画像が本質的にポルノ的なもの (ヌードや性行為を示す)、またはゴーリー (極端な暴力や血液を示す) かどうかを検出します。性的な暗示を含むコンテンツ (わいせつコンテンツ) も検出されます。オブジェクト - 画像内のさまざまなオブジェクト (おおよその位置を含む) を検出します。 Objects 引数は、英語でのみ使用できます。ブランド - 画像内のさまざまなブランド (おおよその場所を含む) を検出します。 Brands 引数は、英語でのみ使用できます。

名前	型	説明
Adult	string
Brands	string
Categories	string
Color	string
Description	string
Faces	string
ImageType	string
Objects	string
Tags	string

Analyze Image - Analyze Image

URI パラメーター

要求ヘッダー

要求本文

応答

セキュリティ

Ocp-Apim-Subscription-Key

例

Successful AnalyzeImage request

Sample Request

Sample Response

定義

AdultInfo

BoundingRect

Category

CategoryDetail

CelebritiesModel

ColorInfo

ComputerVisionError

ComputerVisionErrorCodes

DescriptionExclude

Details

DetectedBrand

DetectedObject

FaceDescription

FaceRectangle

Gender

ImageAnalysis

ImageCaption

ImageDescriptionDetails

ImageMetadata

ImageTag

ImageType

ImageUrl

LandmarksModel

ObjectHierarchy

VisualFeatureTypes

その他のリソース