Analyze Image - Analyze Image

この操作では、画像の内容に基づいて、さまざまな視覚的特徴のセットを抽出できます。 2 つの入力方法がサポートされています。(1) イメージのアップロードまたは (2) イメージ URL の指定。 要求内には、返す機能を選択できる省略可能なパラメーターがあります。 既定では、画像カテゴリは応答で返されます。 成功した応答は JSON で返されます。 要求が失敗した場合、応答にはエラー コードと、何が問題が発生したかを理解するのに役立つメッセージが含まれます。

POST {Endpoint}/vision/v3.1/analyze
POST {Endpoint}/vision/v3.1/analyze?visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}

URI パラメーター

名前 / 必須 説明
Endpoint
path True

string

サポートされている Cognitive Services エンドポイント。

descriptionExclude
query

DescriptionExclude[]

説明を生成するときに、指定したドメイン モデルをオフにします。

details
query

Details[]

返すドメイン固有の詳細を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類には、著名人 - 画像で検出された場合は有名人を識別し、ランドマークはイメージ内の注目すべきランドマークを識別します。

language
query

string

出力生成に必要な言語。 このパラメーターを指定しない場合、既定値は "en" です。サポートされている言語:en - 英語、既定値。 es - スペイン語、ja - 日本語、pt - ポルトガル語、zh - 簡体字中国語。

visualFeatures
query

VisualFeatureTypes[]

返すビジュアル機能の種類を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類は次のとおりです。カテゴリ - ドキュメントで定義されている分類に従って画像コンテンツを分類します。 タグ - 画像のコンテンツに関連する単語の詳細な一覧で画像にタグを付けます。 Description - 英文でのイメージのコンテンツの説明です。 顔 - 顔が存在するかどうかを検出します。 存在する場合は、座標、性別、および年齢を生成します。 ImageType - イメージがクリップアートか線画かを検出します。 [色] - アクセントの色、優先色、イメージが黒&白かどうかを決定します。 成人 - 画像が本質的にポルノ(ヌードや性行為を表す)、またはゴーリー(極端な暴力や血液を示す)であるかどうかを検出します。 性的な暗示を含むコンテンツ (わいせつコンテンツ) も検出されます。 オブジェクト - おおよその位置など、画像内のさまざまなオブジェクトを検出します。 Objects 引数は、英語でのみ使用できます。 [ブランド] - おおよその場所など、画像内のさまざまなブランドを検出します。 Brands 引数は、英語でのみ使用できます。

要求ヘッダー

名前 必須 説明
Ocp-Apim-Subscription-Key True

string

要求本文

名前 必須 説明
url True

string

イメージのパブリックに到達可能な URL。

応答

名前 説明
200 OK

ImageAnalysis

応答には、JSON 形式で抽出された機能が含まれます。 列挙型の定義を次に示します。

ClipartType

非 - クリップアート = 0、あいまい = 1、標準 - クリップアート = 2、良好 - クリップアート = 3。 LineDrawingTypeNon - LineDrawing = 0、LineDrawing = 1。

Other Status Codes

ComputerVisionError

エラー応答。

セキュリティ

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Successful AnalyzeImage request

Sample Request

POST https://westus.api.cognitive.microsoft.com/vision/v3.1/analyze?visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en


{
  "url": "{url}"
}

Sample Response

{
  "categories": [
    {
      "name": "abstract_",
      "score": 0.00390625
    },
    {
      "name": "people_",
      "score": 0.83984375,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 597,
              "top": 162,
              "width": 248,
              "height": 248
            },
            "confidence": 0.999028444
          }
        ]
      }
    },
    {
      "name": "building_",
      "score": 0.984375,
      "detail": {
        "landmarks": [
          {
            "name": "Forbidden City",
            "confidence": 0.9829016923904419
          }
        ]
      }
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isRacyContent": false,
    "isGoryContent": false,
    "adultScore": 0.0934349000453949,
    "racyScore": 0.06861349195241928,
    "goreScore": 0.012872257380997575
  },
  "tags": [
    {
      "name": "person",
      "confidence": 0.9897908568382263
    },
    {
      "name": "man",
      "confidence": 0.9449388980865479
    },
    {
      "name": "outdoor",
      "confidence": 0.938492476940155
    },
    {
      "name": "window",
      "confidence": 0.8951393961906433
    },
    {
      "name": "pangolin",
      "confidence": 0.7250059783791661,
      "hint": "mammal"
    }
  ],
  "description": {
    "tags": [
      "person",
      "man",
      "outdoor",
      "window",
      "glasses"
    ],
    "captions": [
      {
        "text": "Satya Nadella sitting on a bench",
        "confidence": 0.48293603002174407
      }
    ]
  },
  "requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
  "metadata": {
    "width": 1500,
    "height": 1000,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 44,
      "gender": "Male",
      "faceRectangle": {
        "left": 593,
        "top": 160,
        "width": 250,
        "height": 250
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Brown",
    "dominantColorBackground": "Brown",
    "dominantColors": [
      "Brown",
      "Black"
    ],
    "accentColor": "873B59",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "objects": [
    {
      "rectangle": {
        "x": 0,
        "y": 0,
        "w": 50,
        "h": 50
      },
      "object": "tree",
      "confidence": 0.9,
      "parent": {
        "object": "plant",
        "confidence": 0.95
      }
    }
  ],
  "brands": [
    {
      "name": "Pepsi",
      "confidence": 0.857,
      "rectangle": {
        "x": 489,
        "y": 79,
        "w": 161,
        "h": 177
      }
    },
    {
      "name": "Coca-Cola",
      "confidence": 0.893,
      "rectangle": {
        "x": 216,
        "y": 55,
        "w": 171,
        "h": 372
      }
    }
  ]
}

定義

名前 説明
AdultInfo

画像に成人向けコンテンツが含まれているか、わいせつであるかを示す オブジェクト。

BoundingRect

画像内の領域の境界ボックス。

Category

識別されたカテゴリを記述するオブジェクト。

CategoryDetail

追加のカテゴリの詳細を記述する オブジェクト。

CelebritiesModel

著名人識別の可能性を記述するオブジェクト。

ColorInfo

色属性を記述する追加のメタデータを提供する オブジェクト。

ComputerVisionError

API 要求エラーの詳細。

ComputerVisionErrorCodes

エラー コード。

DescriptionExclude

説明を生成するときに、指定したドメイン モデルをオフにします。

Details

返すドメイン固有の詳細を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類は次のとおりです。 [有名人] - 画像で検出された場合は有名人を識別し、ランドマークは画像内の注目すべきランドマークを識別します。

DetectedBrand

画像で検出されたブランド。

DetectedObject

イメージで検出されたオブジェクト。

FaceDescription

画像内で識別される顔を記述するオブジェクト。

FaceRectangle

面の四角形を記述する オブジェクト。

Gender

顔の可能性のある性別。

ImageAnalysis

AnalyzeImage 操作の結果。

ImageCaption

画像キャプション。つまり、画像が示す内容の簡単な説明です。

ImageDescriptionDetails

コンテンツ タグのコレクションと、信頼度レベルで並べ替えられたキャプションの一覧、および画像メタデータ。

ImageMetadata

画像メタデータ。

ImageTag

画像内のエンティティ観察と信頼度スコア。

ImageType

可能なイメージの種類と一致する信頼度レベルを提供する オブジェクト。

ImageUrl
LandmarksModel

画像内で認識されるランドマーク。

ObjectHierarchy

イメージ内で検出されたオブジェクト。

VisualFeatureTypes

返すビジュアル機能の種類を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類には、カテゴリが含まれます。画像コンテンツは、ドキュメントで定義されている分類に従って分類されます。 タグ - 画像の内容に関連する単語の詳細な一覧で画像にタグを付けます。 Description - 英文でのイメージのコンテンツの説明です。 顔 - 顔が存在するかどうかを検出します。 存在する場合は、座標、性別、および年齢を生成します。 ImageType - イメージがクリップアートか線画かを検出します。 [色] - アクセントの色、優勢な色、イメージが黒&白かどうかを決定します。 成人 - 画像が本質的にポルノ的なもの (ヌードや性行為を示す)、またはゴーリー (極端な暴力や血液を示す) かどうかを検出します。 性的な暗示を含むコンテンツ (わいせつコンテンツ) も検出されます。 オブジェクト - 画像内のさまざまなオブジェクト (おおよその位置を含む) を検出します。 Objects 引数は、英語でのみ使用できます。 ブランド - 画像内のさまざまなブランド (おおよその場所を含む) を検出します。 Brands 引数は、英語でのみ使用できます。

AdultInfo

画像に成人向けコンテンツが含まれているか、わいせつであるかを示す オブジェクト。

名前 説明
adultScore

number

画像内で成人向けと見なされるコンテンツの量を示す 0 から 1 までのスコア。

goreScore

number

0 から 1 のスコアを付けて、画像のゴリーの様子を示します。

isAdultContent

boolean

画像に成人向けコンテンツが含まれているかどうかを示す値。

isGoryContent

boolean

画像が gory かどうかを示す値。

isRacyContent

boolean

イメージがわいせつかどうかを示す値。

racyScore

number

画像がどの程度示唆されているかを示す 0 から 1 のスコアを付けます。

BoundingRect

画像内の領域の境界ボックス。

名前 説明
h

integer

領域の左上の点から計測された高さ (ピクセル単位)。

w

integer

領域の左上の点から計測された幅 (ピクセル単位)。

x

integer

領域の左上のポイントの X 座標 (ピクセル単位)。

y

integer

領域の左上の点の Y 座標 (ピクセル単位)。

Category

識別されたカテゴリを記述するオブジェクト。

名前 説明
detail

CategoryDetail

識別されたカテゴリの詳細。

name

string

カテゴリの名前。

score

number

カテゴリのスコアリング。

CategoryDetail

追加のカテゴリの詳細を記述する オブジェクト。

名前 説明
celebrities

CelebritiesModel[]

識別された場合は有名人の配列。

landmarks

LandmarksModel[]

ランドマークが特定された場合は、その配列。

CelebritiesModel

著名人識別の可能性を記述するオブジェクト。

名前 説明
confidence

number

0 ~ 1 の範囲の値としての有名人認識の信頼度レベル。

faceRectangle

FaceRectangle

画像内の識別された顔の場所。

name

string

有名人の名前。

ColorInfo

色属性を記述する追加のメタデータを提供する オブジェクト。

名前 説明
accentColor

string

可能なアクセントカラー。

dominantColorBackground

string

可能な優勢な背景色。

dominantColorForeground

string

可能な優勢な前景色。

dominantColors

string[]

可能な優勢な色の配列。

isBWImg

boolean

イメージが白黒かどうかを示す値。

ComputerVisionError

API 要求エラーの詳細。

名前 説明
code

ComputerVisionErrorCodes

エラー コード。

message

string

サービスによって報告されたエラーを説明するメッセージ。

requestId

string

一意の要求識別子。

ComputerVisionErrorCodes

エラー コード。

名前 説明
BadArgument

string

CancelledRequest

string

DetectFaceError

string

FailedToProcess

string

InternalServerError

string

InvalidDetails

string

InvalidImageFormat

string

InvalidImageSize

string

InvalidImageUrl

string

InvalidModel

string

InvalidThumbnailSize

string

NotSupportedFeature

string

NotSupportedImage

string

NotSupportedLanguage

string

NotSupportedVisualFeature

string

StorageException

string

Timeout

string

Unspecified

string

UnsupportedMediaType

string

DescriptionExclude

説明を生成するときに、指定したドメイン モデルをオフにします。

名前 説明
Celebrities

string

Landmarks

string

Details

返すドメイン固有の詳細を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類は次のとおりです。 [有名人] - 画像で検出された場合は有名人を識別し、ランドマークは画像内の注目すべきランドマークを識別します。

名前 説明
Celebrities

string

Landmarks

string

DetectedBrand

画像で検出されたブランド。

名前 説明
confidence

number

画像内のブランドを観察したという信頼度スコアは、0から1の範囲の値として示される。

name

string

ブランドのラベル。

rectangle

BoundingRect

検出されたブランドのおおよその場所。

DetectedObject

イメージで検出されたオブジェクト。

名前 説明
confidence

number

画像内の物体を観察した信頼度スコアは、0から1の範囲の値として示される。

object

string

オブジェクトのラベル。

parent

ObjectHierarchy

分類の観点から見た親オブジェクト。 親オブジェクトは、このオブジェクトのより汎用的な形式です。 たとえば、"bulldog" には 'dog' の親が含まれます。

rectangle

BoundingRect

検出されたオブジェクトのおおよその位置。

FaceDescription

画像内で識別される顔を記述するオブジェクト。

名前 説明
age

integer

顔の可能な年齢。

faceRectangle

FaceRectangle

識別された顔を含む画像内の四角形。

gender

Gender

顔の可能性のある性別。

FaceRectangle

面の四角形を記述する オブジェクト。

名前 説明
height

integer

顔の左上のポイントから測定された高さ (ピクセル単位)。

left

integer

顔の左上点の X 座標 (ピクセル単位)。

top

integer

顔の左上の点の Y 座標 (ピクセル単位)。

width

integer

面の左上のポイントから測定された幅 (ピクセル単位)。

Gender

顔の可能性のある性別。

名前 説明
Female

string

Male

string

ImageAnalysis

AnalyzeImage 操作の結果。

名前 説明
adult

AdultInfo

画像に成人向けコンテンツが含まれているか、わいせつであるかを示す オブジェクト。

brands

DetectedBrand[]

画像で検出されたブランドの配列。

categories

Category[]

識別されたカテゴリを示す配列。

color

ColorInfo

色属性を記述する追加のメタデータを提供する オブジェクト。

description

ImageDescriptionDetails

コンテンツ タグのコレクションと、信頼度レベルで並べ替えられたキャプションの一覧、および画像メタデータ。

faces

FaceDescription[]

画像内で使用可能な顔の配列。

imageType

ImageType

可能なイメージの種類と一致する信頼度レベルを提供する オブジェクト。

metadata

ImageMetadata

画像メタデータ。

objects

DetectedObject[]

画像で検出された内容を記述するオブジェクトの配列。

requestId

string

REST API 要求の ID。

tags

ImageTag[]

信頼度レベルを持つタグの一覧。

ImageCaption

画像キャプション。つまり、画像が示す内容の簡単な説明です。

名前 説明
confidence

number

サービスがキャプションに持つ信頼度。

text

string

キャプションのテキスト。

ImageDescriptionDetails

コンテンツ タグのコレクションと、信頼度レベルで並べ替えられたキャプションの一覧、および画像メタデータ。

名前 説明
captions

ImageCaption[]

信頼度レベルで並べ替えられたキャプションの一覧。

tags

string[]

イメージ タグのコレクション。

ImageMetadata

画像メタデータ。

名前 説明
format

string

イメージ形式。

height

integer

画像の高さ (ピクセル単位)。

width

integer

画像の幅 (ピクセル単位)。

ImageTag

画像内のエンティティ観察と信頼度スコア。

名前 説明
confidence

number

エンティティが観察された信頼度。

hint

string

このタグの省略可能なヒント/詳細。

name

string

エンティティの名前。

ImageType

可能なイメージの種類と一致する信頼度レベルを提供する オブジェクト。

名前 説明
clipArtType

integer

画像がクリップ アートであるという信頼度。

lineDrawingType

integer

イメージが線画であることを示す信頼度レベル。

ImageUrl

名前 説明
url

string

イメージのパブリックに到達可能な URL。

LandmarksModel

画像内で認識されるランドマーク。

名前 説明
confidence

number

0 ~ 1 の範囲の値としてのランドマーク認識の信頼度レベル。

name

string

ランドマークの名前。

ObjectHierarchy

イメージ内で検出されたオブジェクト。

名前 説明
confidence

number

画像内の物体を観察した信頼度スコアは、0から1までの範囲の値として示される。

object

string

オブジェクトのラベル。

parent

ObjectHierarchy

分類の観点から見た親オブジェクト。 親オブジェクトは、このオブジェクトのより汎用的な形式です。 たとえば、"bulldog" には 'dog' の親が含まれます。

VisualFeatureTypes

返すビジュアル機能の種類を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類には、カテゴリが含まれます。画像コンテンツは、ドキュメントで定義されている分類に従って分類されます。 タグ - 画像の内容に関連する単語の詳細な一覧で画像にタグを付けます。 Description - 英文でのイメージのコンテンツの説明です。 顔 - 顔が存在するかどうかを検出します。 存在する場合は、座標、性別、および年齢を生成します。 ImageType - イメージがクリップアートか線画かを検出します。 [色] - アクセントの色、優勢な色、イメージが黒&白かどうかを決定します。 成人 - 画像が本質的にポルノ的なもの (ヌードや性行為を示す)、またはゴーリー (極端な暴力や血液を示す) かどうかを検出します。 性的な暗示を含むコンテンツ (わいせつコンテンツ) も検出されます。 オブジェクト - 画像内のさまざまなオブジェクト (おおよその位置を含む) を検出します。 Objects 引数は、英語でのみ使用できます。 ブランド - 画像内のさまざまなブランド (おおよその場所を含む) を検出します。 Brands 引数は、英語でのみ使用できます。

名前 説明
Adult

string

Brands

string

Categories

string

Color

string

Description

string

Faces

string

ImageType

string

Objects

string

Tags

string