Analyze Image - Analyze Image
この操作では、画像の内容に基づいて、さまざまな視覚的特徴のセットを抽出できます。 2 つの入力方法がサポートされています。(1) イメージのアップロードまたは (2) イメージ URL の指定。 要求内には、返す機能を選択できる省略可能なパラメーターがあります。 既定では、画像カテゴリは応答で返されます。 成功した応答は JSON で返されます。 要求が失敗した場合、応答にはエラー コードと、何が問題が発生したかを理解するのに役立つメッセージが含まれます。
POST {Endpoint}/vision/v3.1/analyze
POST {Endpoint}/vision/v3.1/analyze?visualFeatures={visualFeatures}&details={details}&language={language}&descriptionExclude={descriptionExclude}
URI パラメーター
名前 | / | 必須 | 型 | 説明 |
---|---|---|---|---|
Endpoint
|
path | True |
string |
サポートされている Cognitive Services エンドポイント。 |
description
|
query |
説明を生成するときに、指定したドメイン モデルをオフにします。 |
||
details
|
query |
Details[] |
返すドメイン固有の詳細を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類には、著名人 - 画像で検出された場合は有名人を識別し、ランドマークはイメージ内の注目すべきランドマークを識別します。 |
|
language
|
query |
string |
出力生成に必要な言語。 このパラメーターを指定しない場合、既定値は "en" です。サポートされている言語:en - 英語、既定値。 es - スペイン語、ja - 日本語、pt - ポルトガル語、zh - 簡体字中国語。 |
|
visual
|
query |
返すビジュアル機能の種類を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類は次のとおりです。カテゴリ - ドキュメントで定義されている分類に従って画像コンテンツを分類します。 タグ - 画像のコンテンツに関連する単語の詳細な一覧で画像にタグを付けます。 Description - 英文でのイメージのコンテンツの説明です。 顔 - 顔が存在するかどうかを検出します。 存在する場合は、座標、性別、および年齢を生成します。 ImageType - イメージがクリップアートか線画かを検出します。 [色] - アクセントの色、優先色、イメージが黒&白かどうかを決定します。 成人 - 画像が本質的にポルノ(ヌードや性行為を表す)、またはゴーリー(極端な暴力や血液を示す)であるかどうかを検出します。 性的な暗示を含むコンテンツ (わいせつコンテンツ) も検出されます。 オブジェクト - おおよその位置など、画像内のさまざまなオブジェクトを検出します。 Objects 引数は、英語でのみ使用できます。 [ブランド] - おおよその場所など、画像内のさまざまなブランドを検出します。 Brands 引数は、英語でのみ使用できます。 |
要求ヘッダー
名前 | 必須 | 型 | 説明 |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
要求本文
名前 | 必須 | 型 | 説明 |
---|---|---|---|
url | True |
string |
イメージのパブリックに到達可能な URL。 |
応答
名前 | 型 | 説明 |
---|---|---|
200 OK |
応答には、JSON 形式で抽出された機能が含まれます。 列挙型の定義を次に示します。 ClipartType 非 - クリップアート = 0、あいまい = 1、標準 - クリップアート = 2、良好 - クリップアート = 3。 LineDrawingTypeNon - LineDrawing = 0、LineDrawing = 1。 |
|
Other Status Codes |
エラー応答。 |
セキュリティ
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
例
Successful AnalyzeImage request
Sample Request
POST https://westus.api.cognitive.microsoft.com/vision/v3.1/analyze?visualFeatures=Categories,Adult,Tags,Description,Faces,Color,ImageType,Objects,Brands&details=Celebrities,Landmarks&language=en
{
"url": "{url}"
}
Sample Response
{
"categories": [
{
"name": "abstract_",
"score": 0.00390625
},
{
"name": "people_",
"score": 0.83984375,
"detail": {
"celebrities": [
{
"name": "Satya Nadella",
"faceRectangle": {
"left": 597,
"top": 162,
"width": 248,
"height": 248
},
"confidence": 0.999028444
}
]
}
},
{
"name": "building_",
"score": 0.984375,
"detail": {
"landmarks": [
{
"name": "Forbidden City",
"confidence": 0.9829016923904419
}
]
}
}
],
"adult": {
"isAdultContent": false,
"isRacyContent": false,
"isGoryContent": false,
"adultScore": 0.0934349000453949,
"racyScore": 0.06861349195241928,
"goreScore": 0.012872257380997575
},
"tags": [
{
"name": "person",
"confidence": 0.9897908568382263
},
{
"name": "man",
"confidence": 0.9449388980865479
},
{
"name": "outdoor",
"confidence": 0.938492476940155
},
{
"name": "window",
"confidence": 0.8951393961906433
},
{
"name": "pangolin",
"confidence": 0.7250059783791661,
"hint": "mammal"
}
],
"description": {
"tags": [
"person",
"man",
"outdoor",
"window",
"glasses"
],
"captions": [
{
"text": "Satya Nadella sitting on a bench",
"confidence": 0.48293603002174407
}
]
},
"requestId": "0dbec5ad-a3d3-4f7e-96b4-dfd57efe967d",
"metadata": {
"width": 1500,
"height": 1000,
"format": "Jpeg"
},
"faces": [
{
"age": 44,
"gender": "Male",
"faceRectangle": {
"left": 593,
"top": 160,
"width": 250,
"height": 250
}
}
],
"color": {
"dominantColorForeground": "Brown",
"dominantColorBackground": "Brown",
"dominantColors": [
"Brown",
"Black"
],
"accentColor": "873B59",
"isBWImg": false
},
"imageType": {
"clipArtType": 0,
"lineDrawingType": 0
},
"objects": [
{
"rectangle": {
"x": 0,
"y": 0,
"w": 50,
"h": 50
},
"object": "tree",
"confidence": 0.9,
"parent": {
"object": "plant",
"confidence": 0.95
}
}
],
"brands": [
{
"name": "Pepsi",
"confidence": 0.857,
"rectangle": {
"x": 489,
"y": 79,
"w": 161,
"h": 177
}
},
{
"name": "Coca-Cola",
"confidence": 0.893,
"rectangle": {
"x": 216,
"y": 55,
"w": 171,
"h": 372
}
}
]
}
定義
名前 | 説明 |
---|---|
Adult |
画像に成人向けコンテンツが含まれているか、わいせつであるかを示す オブジェクト。 |
Bounding |
画像内の領域の境界ボックス。 |
Category |
識別されたカテゴリを記述するオブジェクト。 |
Category |
追加のカテゴリの詳細を記述する オブジェクト。 |
Celebrities |
著名人識別の可能性を記述するオブジェクト。 |
Color |
色属性を記述する追加のメタデータを提供する オブジェクト。 |
Computer |
API 要求エラーの詳細。 |
Computer |
エラー コード。 |
Description |
説明を生成するときに、指定したドメイン モデルをオフにします。 |
Details |
返すドメイン固有の詳細を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類は次のとおりです。 [有名人] - 画像で検出された場合は有名人を識別し、ランドマークは画像内の注目すべきランドマークを識別します。 |
Detected |
画像で検出されたブランド。 |
Detected |
イメージで検出されたオブジェクト。 |
Face |
画像内で識別される顔を記述するオブジェクト。 |
Face |
面の四角形を記述する オブジェクト。 |
Gender |
顔の可能性のある性別。 |
Image |
AnalyzeImage 操作の結果。 |
Image |
画像キャプション。つまり、画像が示す内容の簡単な説明です。 |
Image |
コンテンツ タグのコレクションと、信頼度レベルで並べ替えられたキャプションの一覧、および画像メタデータ。 |
Image |
画像メタデータ。 |
Image |
画像内のエンティティ観察と信頼度スコア。 |
Image |
可能なイメージの種類と一致する信頼度レベルを提供する オブジェクト。 |
Image |
|
Landmarks |
画像内で認識されるランドマーク。 |
Object |
イメージ内で検出されたオブジェクト。 |
Visual |
返すビジュアル機能の種類を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類には、カテゴリが含まれます。画像コンテンツは、ドキュメントで定義されている分類に従って分類されます。 タグ - 画像の内容に関連する単語の詳細な一覧で画像にタグを付けます。 Description - 英文でのイメージのコンテンツの説明です。 顔 - 顔が存在するかどうかを検出します。 存在する場合は、座標、性別、および年齢を生成します。 ImageType - イメージがクリップアートか線画かを検出します。 [色] - アクセントの色、優勢な色、イメージが黒&白かどうかを決定します。 成人 - 画像が本質的にポルノ的なもの (ヌードや性行為を示す)、またはゴーリー (極端な暴力や血液を示す) かどうかを検出します。 性的な暗示を含むコンテンツ (わいせつコンテンツ) も検出されます。 オブジェクト - 画像内のさまざまなオブジェクト (おおよその位置を含む) を検出します。 Objects 引数は、英語でのみ使用できます。 ブランド - 画像内のさまざまなブランド (おおよその場所を含む) を検出します。 Brands 引数は、英語でのみ使用できます。 |
AdultInfo
画像に成人向けコンテンツが含まれているか、わいせつであるかを示す オブジェクト。
名前 | 型 | 説明 |
---|---|---|
adultScore |
number |
画像内で成人向けと見なされるコンテンツの量を示す 0 から 1 までのスコア。 |
goreScore |
number |
0 から 1 のスコアを付けて、画像のゴリーの様子を示します。 |
isAdultContent |
boolean |
画像に成人向けコンテンツが含まれているかどうかを示す値。 |
isGoryContent |
boolean |
画像が gory かどうかを示す値。 |
isRacyContent |
boolean |
イメージがわいせつかどうかを示す値。 |
racyScore |
number |
画像がどの程度示唆されているかを示す 0 から 1 のスコアを付けます。 |
BoundingRect
画像内の領域の境界ボックス。
名前 | 型 | 説明 |
---|---|---|
h |
integer |
領域の左上の点から計測された高さ (ピクセル単位)。 |
w |
integer |
領域の左上の点から計測された幅 (ピクセル単位)。 |
x |
integer |
領域の左上のポイントの X 座標 (ピクセル単位)。 |
y |
integer |
領域の左上の点の Y 座標 (ピクセル単位)。 |
Category
識別されたカテゴリを記述するオブジェクト。
名前 | 型 | 説明 |
---|---|---|
detail |
識別されたカテゴリの詳細。 |
|
name |
string |
カテゴリの名前。 |
score |
number |
カテゴリのスコアリング。 |
CategoryDetail
追加のカテゴリの詳細を記述する オブジェクト。
名前 | 型 | 説明 |
---|---|---|
celebrities |
識別された場合は有名人の配列。 |
|
landmarks |
ランドマークが特定された場合は、その配列。 |
CelebritiesModel
著名人識別の可能性を記述するオブジェクト。
名前 | 型 | 説明 |
---|---|---|
confidence |
number |
0 ~ 1 の範囲の値としての有名人認識の信頼度レベル。 |
faceRectangle |
画像内の識別された顔の場所。 |
|
name |
string |
有名人の名前。 |
ColorInfo
色属性を記述する追加のメタデータを提供する オブジェクト。
名前 | 型 | 説明 |
---|---|---|
accentColor |
string |
可能なアクセントカラー。 |
dominantColorBackground |
string |
可能な優勢な背景色。 |
dominantColorForeground |
string |
可能な優勢な前景色。 |
dominantColors |
string[] |
可能な優勢な色の配列。 |
isBWImg |
boolean |
イメージが白黒かどうかを示す値。 |
ComputerVisionError
API 要求エラーの詳細。
名前 | 型 | 説明 |
---|---|---|
code |
エラー コード。 |
|
message |
string |
サービスによって報告されたエラーを説明するメッセージ。 |
requestId |
string |
一意の要求識別子。 |
ComputerVisionErrorCodes
エラー コード。
名前 | 型 | 説明 |
---|---|---|
BadArgument |
string |
|
CancelledRequest |
string |
|
DetectFaceError |
string |
|
FailedToProcess |
string |
|
InternalServerError |
string |
|
InvalidDetails |
string |
|
InvalidImageFormat |
string |
|
InvalidImageSize |
string |
|
InvalidImageUrl |
string |
|
InvalidModel |
string |
|
InvalidThumbnailSize |
string |
|
NotSupportedFeature |
string |
|
NotSupportedImage |
string |
|
NotSupportedLanguage |
string |
|
NotSupportedVisualFeature |
string |
|
StorageException |
string |
|
Timeout |
string |
|
Unspecified |
string |
|
UnsupportedMediaType |
string |
DescriptionExclude
説明を生成するときに、指定したドメイン モデルをオフにします。
名前 | 型 | 説明 |
---|---|---|
Celebrities |
string |
|
Landmarks |
string |
Details
返すドメイン固有の詳細を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類は次のとおりです。 [有名人] - 画像で検出された場合は有名人を識別し、ランドマークは画像内の注目すべきランドマークを識別します。
名前 | 型 | 説明 |
---|---|---|
Celebrities |
string |
|
Landmarks |
string |
DetectedBrand
画像で検出されたブランド。
名前 | 型 | 説明 |
---|---|---|
confidence |
number |
画像内のブランドを観察したという信頼度スコアは、0から1の範囲の値として示される。 |
name |
string |
ブランドのラベル。 |
rectangle |
検出されたブランドのおおよその場所。 |
DetectedObject
イメージで検出されたオブジェクト。
名前 | 型 | 説明 |
---|---|---|
confidence |
number |
画像内の物体を観察した信頼度スコアは、0から1の範囲の値として示される。 |
object |
string |
オブジェクトのラベル。 |
parent |
分類の観点から見た親オブジェクト。 親オブジェクトは、このオブジェクトのより汎用的な形式です。 たとえば、"bulldog" には 'dog' の親が含まれます。 |
|
rectangle |
検出されたオブジェクトのおおよその位置。 |
FaceDescription
画像内で識別される顔を記述するオブジェクト。
名前 | 型 | 説明 |
---|---|---|
age |
integer |
顔の可能な年齢。 |
faceRectangle |
識別された顔を含む画像内の四角形。 |
|
gender |
顔の可能性のある性別。 |
FaceRectangle
面の四角形を記述する オブジェクト。
名前 | 型 | 説明 |
---|---|---|
height |
integer |
顔の左上のポイントから測定された高さ (ピクセル単位)。 |
left |
integer |
顔の左上点の X 座標 (ピクセル単位)。 |
top |
integer |
顔の左上の点の Y 座標 (ピクセル単位)。 |
width |
integer |
面の左上のポイントから測定された幅 (ピクセル単位)。 |
Gender
顔の可能性のある性別。
名前 | 型 | 説明 |
---|---|---|
Female |
string |
|
Male |
string |
ImageAnalysis
AnalyzeImage 操作の結果。
名前 | 型 | 説明 |
---|---|---|
adult |
画像に成人向けコンテンツが含まれているか、わいせつであるかを示す オブジェクト。 |
|
brands |
画像で検出されたブランドの配列。 |
|
categories |
Category[] |
識別されたカテゴリを示す配列。 |
color |
色属性を記述する追加のメタデータを提供する オブジェクト。 |
|
description |
コンテンツ タグのコレクションと、信頼度レベルで並べ替えられたキャプションの一覧、および画像メタデータ。 |
|
faces |
画像内で使用可能な顔の配列。 |
|
imageType |
可能なイメージの種類と一致する信頼度レベルを提供する オブジェクト。 |
|
metadata |
画像メタデータ。 |
|
objects |
画像で検出された内容を記述するオブジェクトの配列。 |
|
requestId |
string |
REST API 要求の ID。 |
tags |
Image |
信頼度レベルを持つタグの一覧。 |
ImageCaption
画像キャプション。つまり、画像が示す内容の簡単な説明です。
名前 | 型 | 説明 |
---|---|---|
confidence |
number |
サービスがキャプションに持つ信頼度。 |
text |
string |
キャプションのテキスト。 |
ImageDescriptionDetails
コンテンツ タグのコレクションと、信頼度レベルで並べ替えられたキャプションの一覧、および画像メタデータ。
名前 | 型 | 説明 |
---|---|---|
captions |
信頼度レベルで並べ替えられたキャプションの一覧。 |
|
tags |
string[] |
イメージ タグのコレクション。 |
ImageMetadata
画像メタデータ。
名前 | 型 | 説明 |
---|---|---|
format |
string |
イメージ形式。 |
height |
integer |
画像の高さ (ピクセル単位)。 |
width |
integer |
画像の幅 (ピクセル単位)。 |
ImageTag
画像内のエンティティ観察と信頼度スコア。
名前 | 型 | 説明 |
---|---|---|
confidence |
number |
エンティティが観察された信頼度。 |
hint |
string |
このタグの省略可能なヒント/詳細。 |
name |
string |
エンティティの名前。 |
ImageType
可能なイメージの種類と一致する信頼度レベルを提供する オブジェクト。
名前 | 型 | 説明 |
---|---|---|
clipArtType |
integer |
画像がクリップ アートであるという信頼度。 |
lineDrawingType |
integer |
イメージが線画であることを示す信頼度レベル。 |
ImageUrl
名前 | 型 | 説明 |
---|---|---|
url |
string |
イメージのパブリックに到達可能な URL。 |
LandmarksModel
画像内で認識されるランドマーク。
名前 | 型 | 説明 |
---|---|---|
confidence |
number |
0 ~ 1 の範囲の値としてのランドマーク認識の信頼度レベル。 |
name |
string |
ランドマークの名前。 |
ObjectHierarchy
イメージ内で検出されたオブジェクト。
名前 | 型 | 説明 |
---|---|---|
confidence |
number |
画像内の物体を観察した信頼度スコアは、0から1までの範囲の値として示される。 |
object |
string |
オブジェクトのラベル。 |
parent |
分類の観点から見た親オブジェクト。 親オブジェクトは、このオブジェクトのより汎用的な形式です。 たとえば、"bulldog" には 'dog' の親が含まれます。 |
VisualFeatureTypes
返すビジュアル機能の種類を示す文字列。 複数の値をコンマ区切りにする必要があります。 有効なビジュアル機能の種類には、カテゴリが含まれます。画像コンテンツは、ドキュメントで定義されている分類に従って分類されます。 タグ - 画像の内容に関連する単語の詳細な一覧で画像にタグを付けます。 Description - 英文でのイメージのコンテンツの説明です。 顔 - 顔が存在するかどうかを検出します。 存在する場合は、座標、性別、および年齢を生成します。 ImageType - イメージがクリップアートか線画かを検出します。 [色] - アクセントの色、優勢な色、イメージが黒&白かどうかを決定します。 成人 - 画像が本質的にポルノ的なもの (ヌードや性行為を示す)、またはゴーリー (極端な暴力や血液を示す) かどうかを検出します。 性的な暗示を含むコンテンツ (わいせつコンテンツ) も検出されます。 オブジェクト - 画像内のさまざまなオブジェクト (おおよその位置を含む) を検出します。 Objects 引数は、英語でのみ使用できます。 ブランド - 画像内のさまざまなブランド (おおよその場所を含む) を検出します。 Brands 引数は、英語でのみ使用できます。
名前 | 型 | 説明 |
---|---|---|
Adult |
string |
|
Brands |
string |
|
Categories |
string |
|
Color |
string |
|
Description |
string |
|
Faces |
string |
|
ImageType |
string |
|
Objects |
string |
|
Tags |
string |