画像の説明

Azure AI Vision では、画像を分析し、人間が判読できる言語で、その内容を説明する語句を生成できます。 アルゴリズムにより、さまざまな視覚化機能に基づいて複数の説明が返されます。各説明には、信頼度スコアが付与されます。 最終的には、各説明を信頼度の高い順に並べたリストが出力されます。

現時点では、イメージの説明でサポートされている言語は英語のみです。

Vision Studio を使用して、ブラウザーですばやく簡単に画像キャプションの機能を試すことができます。

画像の説明の例

次の JSON 応答は、視覚的特徴に基づいてサンプル画像を説明するときに、Analyze API から返される内容を示します。

マンハッタンのビル群の白黒写真

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

API の使用

画像説明機能は Analyze Image API に含まれています。 ネイティブ SDK または REST を呼び出すことでこの API を呼び出すことができます。 DescriptionvisualFeatures クエリ パラメーターに追加します。 次に、完全な JSON 応答が得られたら、"description" セクションのコンテンツの文字列を解析します。

次のステップ

画像へのタグ付けおよび画像の分類に関連する概念を学習します。