オブジェクト検出器をトレーニングする

完了

"物体検出" は、モデルをトレーニングして画像内の物体から 1 つまたは複数のクラスの存在と位置を検出する、コンピューター ビジョンの一種です。

検出された果物の場所と種類を含む写真。

物体検出の予測には、次の 2 つのコンポーネントがあります。

  • 画像で検出された各物体のクラス ラベル。 たとえば、画像にリンゴ、オレンジ、バナナが含まれていることを確認できます。
  • 画像内の各物体の位置。物体を囲む "境界ボックス" の座標として示されます。

物体検出モデルをトレーニングするには、Azure AI Custom Vision ポータルを使用して、モデルのトレーニング、評価、テスト、発行の前に画像をアップロードしてラベル付けできます。または、REST API または言語固有の SDK を使用して、トレーニング タスクを実行するコードを記述できます。

画像のラベル付け

Azure AI Custom Vision を使用して、 画像分類 または 物体検出用のプロジェクトを作成できます。 画像分類モデルのトレーニングと物体検出モデルのトレーニングの最も大きな違いは、タグを使用した画像のラベル付けです。 画像分類には画像全体に適用される 1 つ以上のタグが必要ですが、オブジェクト検出では、各ラベルが、画像内の各オブジェクトの境界ボックスを定義するタグと 領域 で構成されている必要があります。

Azure AI Custom Vision ポータルでのイメージのラベル付け

Azure AI Custom Vision ポータルには、トレーニング 画像のラベル付けに使用できるグラフィカル インターフェイスが用意されています。

Azure AI Custom Vision ポータルでタグ付けされた画像のスクリーンショット。

物体検出用の画像にラベルを付ける最も簡単なオプションは、Azure AI Custom Vision ポータルで対話型インターフェイスを使用することです。 このインターフェイスは、ラベルを付けるオブジェクトを囲むように境界ボックスをドラッグしてタグを割り当てたり、調整したりできるオブジェクトを含む領域を自動的に提案します。

さらに、画像の最初のバッチにタグを付けた後、モデルをトレーニングできます。 新しいイメージの後続のラベル付けは、ポータルの スマート ラベラー ツールを利用できます。このツールは、領域だけでなく、含まれるオブジェクトのクラスも提案できます。

代替ラベル付け方法

または、カスタムまたはサード パーティ製のラベル付けツールを使用したり、画像に手動でラベルを付けたりして、画像のラベル付けタスクを複数のチーム メンバーに割り当てるなどの他の機能を利用することもできます。

Azure AI Custom Vision ポータル以外のラベル付けツールを使用する場合は、Azure AI Custom Vision API で期待される測定単位に合わせて出力を調整することが必要になる場合があります。 境界ボックスは、境界ボックスの左上隅の左 (X) 座標と上 (Y) 座標、および境界ボックスの幅と高さを表す 4 つの値によって定義されます。 これらの値は、ソース イメージ のサイズに対する 比例 値として表されます。 たとえば、次の境界ボックスについて考えてみます。

  • 左:0.1
  • 上:0.5
  • 幅: 0.5
  • 高さ: 0.25

これにより、左側が画像の左端から 0.1 (10 分の 1)、上が上から 0.5 (画像の高さの半分) であるボックスが定義されます。 ボックスは、画像全体の幅の半分と高さの 4 分の 1 です。

次の図は、画像内のオブジェクトの JSON 形式のラベル付け情報を示しています。

含まれているオブジェクトの JSON ラベルを使用して写真を撮影します。