Product Recognition (バージョン 4.0 プレビュー)

[アーティクル]
02/22/2024

Product Recognition API を使用すると、小売店の棚の写真を分析できます。製品の存在を検出し、境界ボックス座標を取得できます。モデルのカスタマイズと組み合わせて使用して、特定の製品を識別するようにモデルをトレーニングします。 Product Recognition の結果を店舗のプラノグラムドキュメントと比較することもできます。

Vision Studio を使用して、ブラウザーですばやく簡単に Product Recognition の機能を試すことができます。

Vision Studio を試す

Photo of a shelf with products and gaps outlined in rectangles.

Note

画像に表示されているブランドは Microsoft と提携しておらず、Microsoft または Microsoft 製品のブランド所有者による保証、またはブランド所有者またはその製品の Microsoft による保証を示すものではありません。

重要

Custom Vision サービスまたは Image Analysis 4.0 Product Recognition API を使用して、製品認識用のカスタムモデルをトレーニングできます。次の表は、この 2 つのサービスを比較しています。

Areas

市販製品 – カスタムビジョン

製品認識 – イメージ分析 API/カスタマイズ

機能

カスタム製品の理解

画像の結合と修正、
事前トレーニング済み製品の理解、
カスタム製品の理解、
Planogram matching

基本モデル

CNN

Florence トランスフォーマーモデル

ラベル

Customvision.ai

AML Studio

Web ポータル

Customvision.ai

Vision Studio

ライブラリ

REST、SDK

REST、Python サンプル

必要最小限のトレーニングデータ

カテゴリごとに 15 個のイメージ

カテゴリごとに 2-5 個のイメージ

トレーニングデータのストレージ

サービスにアップロード済み

顧客の BLOB ストレージアカウント

モデルのホスティング

クラウドとエッジ

クラウドホスティングのみ、エッジコンテナーホスティングは今後予定されています

AI の品質

context	Top-1 精度、14 データセット
1 ショット (カタログ)	29.4
2 ショット	57.1
3 ショット	66.7
5 ショット	80.8
10 ショット	86.4
full	94.9

context	Top-1 精度、14 データセット
1 ショット (カタログ)	86.9
2 ショット	88.8
3 ショット	89.8
5 ショット	90.3
10 ショット	91.0
full	95.4

価格

Custom Vision の価格

画像分析の価格

Product Recognition 機能

シェルフイメージコンポジション

Stitching API と Rectification API を使用すると、Product Understanding の結果の精度を向上させるように画像を修正することができます。これらの API を使用すると、次のことができます。

棚にある複数の画像をつなぎ合わせて、1 つの画像を作成する。
画像を修正して、奥行の歪みを取り除く。

シェルフ製品認識 (事前トレーニング済みモデル)

Product Understanding API を使用すると、すぐに使用できる事前トレーニング済みのモデルを使用して棚の画像を分析することができます。この操作では、棚の画像内の製品とギャップを検出し、各製品とギャップの境界ボックス座標と、それぞれの信頼度スコアを返します。

次の JSON 応答は、Product Understanding API から返される内容を示しています。

{
  "imageMetadata": {
    "width": 2000,
    "height": 1500
  },
  "products": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 12,
        "h": 12
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "string"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 123,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "string"
        }
      ]
    }
  ]
}

シェルフ製品認識 (カスタマイズされたモデル)

Product Understanding API では、カスタムトレーニング済みモデルと共に使用して、特定の製品を検出することもできます。この操作は、各製品とギャップの境界ボックス座標と、各製品のラベルを返します。

次の JSON 応答は、カスタムモデルと共に使用した場合の Product Understanding API から返される内容を示しています。

"detectedProducts": {
  "imageMetadata": {
    "width": 21,
    "height": 25
  },
  "products": [
    {
      "id": "01",
      "boundingBox": {
        "x": 123,
        "y": 234,
        "w": 34,
        "h": 45
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "Product1"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "02",
      "boundingBox": {
        "x": 12,
        "y": 123,
        "w": 1234,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "Product1"
        }
      ]
    }
  ]
}

シェルフプラノグラムのコンプライアンス

Planogram matching API を使用すると、Product Understanding API の結果をプラノグラムドキュメントと比較できます。この操作では、検出された各製品とギャップを、プラノグラムドキュメント内の対応する位置と照合します。

製品またはギャップによって占有されているかどうかに関係なく、プラノグラムドキュメント内の各位置を考慮した JSON 応答が返されます。

{
  "matchedResultsPerPosition": [
    {
      "positionId": "01",
      "detectedObject": {
        "id": "01",
        "boundingBox": {
          "x": 12,
          "y": 1234,
          "w": 123,
          "h": 12345
        },
        "classifications": [
          {
            "confidence": 0.9,
            "label": "Product1"
          }
        ]
      }
    }
  ]
}

制限事項

Product Recognition は、米国東部および米国西部 2 のAzure リージョンでのみ利用できます。
棚の画像のサイズは最大 20 MB です。 4 MB が推奨されます。
アップロードして分析する前に、棚の画像に合成と修正を行うことをお勧めします。
Product Recognition ではカスタムモデルの使用を省略できますが、Planogram matching 関数では必須となります。

次の手順

Stitching API と Rectification API を試して、Product Recognition の使用を開始します。次に、Product Understanding API を使用して基本的な分析を行います。