画像の説明
Azure AI Vision では、画像を分析し、人間が判読できる言語で、その内容を説明する語句を生成できます。 サービスにより、さまざまな視覚化機能に基づいて複数の説明が返されます。各説明には、信頼度スコアが付与されます。 最終的には、各説明を信頼度の高い順に並べたリストが出力されます。
イメージの説明でサポートされている言語は英語のみです。
Vision Studio を使用して、ブラウザーですばやく簡単に画像キャプションの機能を試すことができます。
画像の説明の例
次の JSON 応答は、視覚的特徴に基づいてサンプル画像を説明するときに、Analyze Image API から返される内容を示します。
{
"description":{
"tags":[
"outdoor",
"city",
"white"
],
"captions":[
{
"text":"a city with tall buildings",
"confidence":0.48468858003616333
}
]
},
"requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
"metadata":{
"height":300,
"width":239,
"format":"Png"
},
"modelVersion":"2021-05-01"
}
API の使用
画像説明機能は Analyze Image API に含まれています。 ネイティブ SDK または REST を呼び出すことでこの API を呼び出すことができます。 Description
を visualFeatures クエリ パラメーターに追加します。 次に、完全な JSON 応答が得られたら、"description"
セクションのコンテンツの文字列を解析します。