ドメイン固有のコンテンツの検出

[アーティクル]
01/29/2024

タグ付けと高度なカテゴリ化に加えて、Azure AI Vision では、特殊なデータでトレーニング済みのモデルを使用した詳細なドメイン固有の解析もサポートされます。

ドメイン固有のモデルの使用方法には、それ自体による方法 (スコープ解析) と、画像の分類機能の拡張機能として使用する方法の 2 通りがあります。

スコープされた分析

選択したドメイン固有のモデルのみを使用してイメージを分析するには、Models/<model>/Analyze API を使用します。

特定のイメージについて、models/celebrities/analyze API で返される JSON 応答の例を次に示します。

Satya Nadella standing, smiling

{
  "result": {
    "celebrities": [{
      "faceRectangle": {
        "top": 391,
        "left": 318,
        "width": 184,
        "height": 184
      },
      "name": "Satya Nadella",
      "confidence": 0.99999856948852539
    }]
  },
  "requestId": "8217262a-1a90-4498-a242-68376a4b956b",
  "metadata": {
    "width": 800,
    "height": 1200,
    "format": "Jpeg"
  }
}

拡張カテゴリ化解析

ドメイン固有のモデルを使用して、一般的なイメージ解析を補足することもできます。これは、Analyze API 呼び出しの details パラメーターにドメイン固有のモデルを指定して、大まかなカテゴリ化の一部として行います。

この場合、最初に 86 のカテゴリ分類の分類子が呼び出されます。検出されたカテゴリのいずれかに、一致するドメイン固有のモデルがあった場合、イメージはそのモデルもパススルーし、結果が追加されます。

次の JSON 応答は、ドメイン固有の解析を detail ノードとしてより広範なカテゴリ化解析に含める方法を示しています。

"categories":[
  {
    "name":"abstract_",
    "score":0.00390625
  },
  {
    "name":"people_",
    "score":0.83984375,
    "detail":{
      "celebrities":[
        {
          "name":"Satya Nadella",
          "faceRectangle":{
            "left":597,
            "top":162,
            "width":248,
            "height":248
          },
          "confidence":0.999028444
        }
      ],
      "landmarks":[
        {
          "name":"Forbidden City",
          "confidence":0.9978346
        }
      ]
    }
  }
]

ドメイン固有のモデルの一覧

現在、Azure AI Vision では、次のドメイン固有モデルがサポートされています。

名前	説明
celebrities	著名人の認識、`people_` カテゴリに分類された画像についてサポート
landmarks	ランドマークの認識、`outdoor_` または `building_` カテゴリに分類された画像についてサポート

Models API を呼び出すと、各モデルを適用できるカテゴリと共に、この情報が返されます。

{
  "models":[
    {
      "name":"celebrities",
      "categories":[
        "people_",
        "人_",
        "pessoas_",
        "gente_"
      ]
    },
    {
      "name":"landmarks",
      "categories":[
        "outdoor_",
        "户外_",
        "屋外_",
        "aoarlivre_",
        "alairelibre_",
        "building_",
        "建筑_",
        "建物_",
        "edifício_"
      ]
    }
  ]
}

API の使用

この機能は、Analyze Image 3.2 API を介して使用できます。ネイティブ SDK または REST を呼び出すことでこの API を呼び出すことができます。 details クエリパラメーターに Celebrities または Landmarks を含めます。その後、完全な JSON 応答が得られたら、"details" セクションのコンテンツを対象に文字列を解析します。

クイックスタート: Vision REST API またはクライアントライブラリ

ドメイン固有のコンテンツの検出

スコープされた分析

拡張カテゴリ化解析

ドメイン固有のモデルの一覧

API の使用

その他のリソース