Product Recognition (バージョン 4.0 プレビュー)

Product Recognition API を使用すると、小売店の棚の写真を分析できます。 製品の存在を検出し、境界ボックス座標を取得できます。 モデルのカスタマイズと組み合わせて使用して、特定の製品を識別するようにモデルをトレーニングします。 Product Recognition の結果を店舗のプラノグラム ドキュメントと比較することもできます。

Vision Studio を使用して、ブラウザーですばやく簡単に Product Recognition の機能を試すことができます。

Photo of a shelf with products and gaps outlined in rectangles.

Note

画像に表示されているブランドは Microsoft と提携しておらず、Microsoft または Microsoft 製品のブランド所有者による保証、またはブランド所有者またはその製品の Microsoft による保証を示すものではありません。

重要

Custom Vision サービスまたは Image Analysis 4.0 Product Recognition API を使用して、製品認識用のカスタム モデルをトレーニングできます。 次の表は、この 2 つのサービスを比較しています。

Areas 市販製品 – カスタムビジョン 製品認識 – イメージ分析 API/カスタマイズ
機能 カスタム製品の理解 画像の結合と修正、
事前トレーニング済み製品の理解、
カスタム製品の理解、
Planogram matching
基本モデル CNN Florence トランスフォーマー モデル
ラベル Customvision.ai AML Studio
Web ポータル Customvision.ai Vision Studio
ライブラリ REST、SDK REST、Python サンプル
必要最小限のトレーニング データ カテゴリごとに 15 個のイメージ カテゴリごとに 2-5 個のイメージ
トレーニング データのストレージ サービスにアップロード済み 顧客の BLOB ストレージ アカウント
モデルのホスティング クラウドとエッジ クラウド ホスティングのみ、エッジ コンテナー ホスティングは今後予定されています
AI の品質
contextTop-1 精度、14 データセット
1 ショット (カタログ)29.4
2 ショット57.1
3 ショット66.7
5 ショット80.8
10 ショット86.4
full94.9
contextTop-1 精度、14 データセット
1 ショット (カタログ)86.9
2 ショット88.8
3 ショット89.8
5 ショット90.3
10 ショット91.0
full95.4
価格 Custom Vision の価格 画像分析の価格

Product Recognition 機能

シェルフ イメージ コンポジション

Stitching API と Rectification API を使用すると、Product Understanding の結果の精度を向上させるように画像を修正することができます。 これらの API を使用すると、次のことができます。

  • 棚にある複数の画像をつなぎ合わせて、1 つの画像を作成する。
  • 画像を修正して、奥行の歪みを取り除く。

シェルフ製品認識 (事前トレーニング済みモデル)

Product Understanding API を使用すると、すぐに使用できる事前トレーニング済みのモデルを使用して棚の画像を分析することができます。 この操作では、棚の画像内の製品とギャップを検出し、各製品とギャップの境界ボックス座標と、それぞれの信頼度スコアを返します。

次の JSON 応答は、Product Understanding API から返される内容を示しています。

{
  "imageMetadata": {
    "width": 2000,
    "height": 1500
  },
  "products": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 12,
        "h": 12
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "string"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 123,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "string"
        }
      ]
    }
  ]
}

シェルフ製品認識 (カスタマイズされたモデル)

Product Understanding API では、カスタム トレーニング済みモデル と共に使用して、特定の製品を検出することもできます。 この操作は、各製品とギャップの境界ボックス座標と、各製品のラベルを返します。

次の JSON 応答は、カスタム モデルと共に使用した場合の Product Understanding API から返される内容を示しています。

"detectedProducts": {
  "imageMetadata": {
    "width": 21,
    "height": 25
  },
  "products": [
    {
      "id": "01",
      "boundingBox": {
        "x": 123,
        "y": 234,
        "w": 34,
        "h": 45
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "Product1"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "02",
      "boundingBox": {
        "x": 12,
        "y": 123,
        "w": 1234,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "Product1"
        }
      ]
    }
  ]
}

シェルフ プラノグラムのコンプライアンス

Planogram matching API を使用すると、Product Understanding API の結果をプラノグラム ドキュメントと比較できます。 この操作では、検出された各製品とギャップを、プラノグラム ドキュメント内の対応する位置と照合します。

製品またはギャップによって占有されているかどうかに関係なく、プラノグラム ドキュメント内の各位置を考慮した JSON 応答が返されます。

{
  "matchedResultsPerPosition": [
    {
      "positionId": "01",
      "detectedObject": {
        "id": "01",
        "boundingBox": {
          "x": 12,
          "y": 1234,
          "w": 123,
          "h": 12345
        },
        "classifications": [
          {
            "confidence": 0.9,
            "label": "Product1"
          }
        ]
      }
    }
  ]
}

制限事項

  • Product Recognition は、米国東部および米国西部 2 のAzure リージョンでのみ利用できます。
  • 棚の画像のサイズは最大 20 MB です。 4 MB が推奨されます。
  • アップロードして分析する前に、棚の画像に合成と修正を行うことをお勧めします。
  • Product Recognition ではカスタム モデルの使用を省略できますが、Planogram matching 関数では必須となります。

次の手順

Stitching API と Rectification API を試して、Product Recognition の使用を開始します。 次に、Product Understanding API を使用して基本的な分析を行います。