画像とテキスト ドキュメントにラベルを付ける

プロジェクト管理者が Azure Machine Learning の画像データのラベル付けプロジェクトまたは Azure Machine Learning のテキスト データのラベル付けプロジェクトを作成したら、ラベル付けツールを使用して Machine Learning プロジェクト用のデータを迅速に準備できます。 この記事では、次の内容について説明します。

  • ラベル付けプロジェクトにアクセスする方法
  • ラベル付けツール
  • 特定のラベル付けタスクにツールを使用する方法

前提条件

  • Microsoft アカウント、または組織とプロジェクト用の Microsoft Entra アカウント。
  • ラベル付けプロジェクトが含まれているワークスペースへの共同作成者レベルのアクセス。

スタジオにサインインする

  1. Azure Machine Learning Studio にサインインします。

  2. サブスクリプションと、ラベル付けプロジェクトが含まれているワークスペースを選択します。 この情報はプロジェクト管理者に問い合わせてください。

  3. アクセス レベルによっては、左側に複数のセクションが表示される場合があります。 その場合は、左側にある [データのラベル付け] を選択して、プロジェクトを見つけます。

ラベル付けタスクを理解する

データのラベル付けプロジェクトのテーブルで、ご自分のプロジェクトの [ラベル データ] リンクを選択します。

対象のプロジェクトに固有の指示が表示されます。 これらには、取り扱うデータの種類、意思決定の方法、その他の関連情報が記載されています。 情報を読み、ページの上部にある [タスク] を選択します。 ページの下部にある [ラベル付けの開始] を選び選択することもできます。

ラベルの選択

データのラベル付けタスクすべてで、プロジェクト管理者が指定したセットから適切なタグを 1 つまたは複数選択します。 最初の 9 つのタグの選択には、キーボードの数値キーを使用できます。

支援型機械学習

ラベル付け中に機械学習アルゴリズムがトリガーされることがあります。 プロジェクトでこれらのアルゴリズムが有効になっている場合は、次の情報が表示される場合があります。

  • Images

    • ある程度の量のデータがラベル付けされると、画面上部のプロジェクト名の横に [クラスター化されたタスク] が表示されることがあります。 似ている画像を同じページに表示するために画像がグループ化されます。 これが表示された場合、そのグループ化を活用するためには、複数の画像ビューのいずれかに切り替えます。

    • 後で、プロジェクト名の横に [事前ラベル付きのタスク] が表示されることがあります。 項目は、機械学習の分類モデルによって生成された推奨ラベルとともに表示されます。 100% の精度を持つ機械学習モデルはありません。 使用するのはモデルが確信を持てるデータのみですが、それらのデータ値でも、正しくない事前ラベルが付いている可能性があります。 ラベルが表示されたら、ページを送信する前に、正しくないラベルを修正してください。

    • オブジェクト識別モデルの場合、境界ボックスとラベルが既に表示されている可能性があります。 ページを送信する前に、間違いをすべて修正してください。

    • セグメント化モデルの場合、ポリゴンとラベルが既に表示されている可能性があります。 ページを送信する前に、間違いをすべて修正してください。

  • Text

    • やがて、プロジェクト名の横に [事前ラベル付きのタスク] と表示される場合があります。 項目は、機械学習の分類モデルが生成した推奨ラベルとともに表示されます。 100% の精度を持つ機械学習モデルはありません。 使用するのはモデルが確信を持てるデータのみですが、それらのデータ値でも、事前ラベル付けが正しくない可能性があります。 そうしたラベルを見つけたら、ページを送信する前に、間違ったラベルを修正してください。

ラベル付けプロジェクトの早い段階では、機械学習モデルに、小さな画像サブセットに事前ラベル付けするのに十分な精度しかない場合があります。 これらの画像にラベルが付けられると、次のモデル トレーニング期間用にさらに多くのデータを収集するため、ラベル付けプロジェクトは手動でのラベル付けに戻ります。 やがて、モデルがさらに確信を持てる画像の比率が高くなります。 プロジェクトの後半では、その確信により、事前ラベル付きタスクが多くなります。

事前ラベル付きタスクがなくなったら、ラベルの確認または修正を停止して、手動での項目へのタグ付けに戻ります。

画像タスク

画像分類タスクに対しては、複数の画像を同時に表示することができます。 画像領域の上にあるアイコンを使用して、レイアウトを選択します。

表示されているすべての画像を同時に選択するには、 [すべて選択] を使用します。 個々の画像を選択するには、画像の右上隅にある円形の選択ボタンを使用します。 タグを適用する画像を少なくとも 1 つ選択する必要があります。 複数の画像を選択すると、選択したすべての画像に選択したタグが適用されます。

ここでは、2 対 2 のレイアウトを選択し、クマとシャチの画像にタグ "Mammal" (哺乳類) を適用しました。 サメの画像には既に "Cartilaginous fish" (軟骨魚類) のタグが付いていて、イグアナにはタグがまだありません。

Multiple image layouts and selection

重要

レイアウトを切り替えるのは、ラベルの付いていないデータの新しいページがあるときのみにしてください。 レイアウトを切り替えると、ページの進行中のタグ付け作業がクリアされます。

ページ上のすべての画像にタグを付けると、Azure で [送信] ボタンが有効になります。 [送信] を選択して作業内容を保存します。

手元にあるデータのタグを送信すると、Azure によって作業キューの新しい画像セットを使ってページが更新されます。

医療画像タスク

重要

DICOM または同様の画像の種類にラベルを付ける機能は、医療デバイス、臨床サポート、診断ツール、または他のテクノロジ (病気や他の状況の診断、治療、軽減、取り扱い、防止での使用が意図されているもの) として使用することを意図されたり、使用できるようにされているものではなく、そのような目的でのこの機能の使用に対して、Microsoft からはライセンスや権利は付与されません。 この機能は、専門的な医療のアドバイスや医学的意見、診断、治療、または医療専門家による医学的判断に代わるものとして実装またはデプロイするために設計されたり、それを意図されたりしたものではなく、そのようには使用しないでください。 お客様は、DICOM または同様の画像の種類のデータのラベル付けの使用についてのみ責任を負います。

画像プロジェクトでは、DICOM 画像形式の X 線ファイル画像をサポートしています。

X-ray DICOM image to be labeled.

医療画像には他の画像と同じツールでラベルを付けることができますが、DICOM 画像用の別のツールを使用できます。 画像の濃度を変更するには、 [Window and level](ウィンドウとレベル) ツールを選択します。 このツールは、DICOM 画像に対してのみ使用できます。

Window and level tool for DICOM images.

複数クラス分類用に画像にタグを付ける

"画像分類 (マルチクラス)" のプロジェクトの種類の画像全体に 1 つのタグを割り当てます。 任意のタイミングで指示を確認するには、[指示] ページに移動し、[詳細な指示の表示] を選択します。

画像にタグを割り当てた後に間違えたことがわかった場合は、修正できます。 画像の下に表示されているラベルの [X] を選択して、タグをクリアします。 画像を選択して、別のクラスを選択することもできます。 新しく選択した値によって、以前に適用したタグが置き換えられます。

複数ラベル分類用に画像にタグを付ける

プロジェクトの種類が "画像分類 (マルチラベル)" の場合は、画像に 1 つ "以上" のタグを適用します。 プロジェクト固有の指示を表示するには、[指示] を選択し、[詳細な指示の表示] に移動します。

ラベルを付ける画像を選択して、タグを選択します。 選択したすべての画像にタグが適用された後、画像が選択解除されます。 さらにタグを適用するには、画像を再び選択する必要があります。 次のアニメーションでは、複数ラベルのタグ付けを示しています。

  1. "Ocean" (海洋) タグを適用するために [すべて選択] が使用されています。
  2. 1 つの画像が選択され、"Closeup" (クローズアップ) というタグが付けられています。
  3. 3 つの画像が選択され、"Wide angle" (ワイド アングル) というタグが付けられています。

Animation shows multilabel flow

間違いを修正するには、[X] を選択して個々のタグをクリアするか、画像を選択してタグを選択します。これで、選択したすべての画像からタグがクリアされます。 このシナリオを次に示します。 "Land" (陸上) を選択すると、選択した 2 つの画像からそのタグがクリアされます。

A screenshot shows multiple deselections

Azure では、各画像に少なくとも 1 つのタグを適用した後にのみ [送信] ボタンが有効になります。 [送信] を選択して作業内容を保存します。

オブジェクト検出のために画像にタグを付けて境界ボックスを指定する

プロジェクトの種類が "オブジェクト ID (境界ボックス)" の場合は、画像内の境界ボックスを 1 つ以上指定して、各ボックスにタグを適用します。 画像には、複数の境界ボックスがあり、それぞれに 1 つのタグがあります。 [詳細な指示の表示] を使用して、プロジェクトで複数の境界ボックスが使用されているかどうかを判別します。

  1. 作成する予定の境界ボックスのタグを選択します。
  2. 四角形のボックス ツール Rectangular box tool を選択するか、R キーを押します。
  3. ターゲットを選択して斜めにドラッグすると、おおまかな境界ボックスが作成されます。 境界ボックスを調整するには、端または角をドラッグします。

Bounding box creation

境界ボックスを削除するには、作成後に境界ボックスの横に表示される X 形のターゲットを選択します。

既存の境界ボックスのタグを変更することはできません。 タグの割り当ての間違いを修正するには、境界ボックスを削除し、正しいタグで新しく作成する必要があります。

既定では、既存の境界ボックスを編集できます。 [領域のロック/ロック解除] ツール Lock/unlock regions tool または L キーを使用して、その動作を切り替えます。 領域がロックされている場合は、新しい境界ボックスの形状または位置しか変更できません。

領域操作ツール This is the regions manipulation tool icon - four arrows pointing outward from the center, up, right, down, and left. または M キーを使用して、既存の境界ボックスを調整します。 形状を調整するには、端または角をドラッグします。 境界ボックス全体をドラッグする場合は、内側を選択します。 領域を編集できない場合は、領域のロック/ロック解除ツールを切り替えたことが考えられます。

テンプレートベースのボックス ツール Template-box tool または T キーを使用して、同じサイズの複数の境界ボックスを作成します。 画像に境界ボックスがなく、テンプレートベースのボックスをアクティブにすると、ツールによって 50 x 50 ピクセルのボックスが生成されます。 境界ボックスを作成してからテンプレートベースのボックスをアクティブにすると、新しい境界ボックスはすべて、最後に作成したボックスのサイズと一致します。 テンプレートベースのボックスは、配置後にサイズ変更できます。 テンプレートベースのボックスのサイズを変更すると、そのボックスのサイズのみが変更されます。

現在の画像に含まれる "すべて" の境界ボックスを削除するには、[すべての領域の削除] ツール Delete regions tool を選択します。

画像の境界ボックスを作成した後、 [送信] を選択して作業内容を保存します。そうしないと、進行中の作業は保存されません。

画像にタグ付けし、画像をセグメント化するためにポリゴンを指定する

プロジェクトの種類が "インスタンスのセグメント化 (ポリゴン)" の場合は、画像内の 1 つ以上のポリゴンを指定して、各ポリゴンにタグを適用します。 画像に複数の境界ポリゴンを指定し、それぞれに 1 つのタグを適用できます。 [詳細な指示の表示] を使用して、プロジェクトで複数の境界ポリゴンが使用されているかどうかを判別します。

  1. 作成するポリゴンのタグを選択します。

  2. ポリゴン領域の描画ツール Draw polygon region tool を選択するか、P キーを押します。

  3. ポリゴンの各ポイントを選択します。 形状が完成したら、ダブルクリックして終了します。

    Create polygons for Cat and Dog

ポリゴンを削除するには、作成後にポリゴンの横に表示される X 形のターゲットを選択します。

ポリゴンのタグを変更するには、領域の移動ツールを選択し、ポリゴンを選択して、適切なタグを選択します。

既存のポリゴンを編集することができます。 領域のロック/ロック解除ツール Edit polygons with the lock/unlock regions tool または L キーを使用して、その動作を切り替えます。 領域がロックされている場合は、新しいポリゴンの形状または位置しか変更できません。

多角形ポイントの追加または削除ツールThis is the add or remove polygon points tool icon. または U キーを使用して、既存のポリゴンを調整します。 ポイントを追加または削除するポリゴンを選択します。 領域を編集できない場合は、領域のロック/ロック解除ツールを切り替えたことが考えられます。

現在の画像に含まれる "すべて" のポリゴンを削除するには、[すべての領域の削除] ツール Delete all regions tool を選択します。

画像のポリゴンを作成したら、 [送信] を選択して作業内容を保存します。そうしないと、進行中の作業は保存されません。

セマンティック セグメント化のために画像にタグを付け、マスクを描画する

プロジェクトの種類が "セマンティック セグメント化 (プレビュー)" の場合は、ペイントブラシを使用して、タグ付けする領域にマスクを描画します。

  1. 描画する領域のタグを選択します。

  2. [ペイントブラシ] ツール Screenshot of the Paintbrush tool. を選択します。

  3. [サイズ] ツール Screenshot of the Size tool. を選択して、ペイントブラシのサイズを選びます。

  4. タグ付けする領域を描画します。 タグに対応する色は、描画する領域に適用されます。

    Screenshot of paint area for cat and dog faces for semantic segmentation.

領域の一部を削除するには、[消しゴム] ツールを選択します。

領域のタグを変更するには、新しいタグを選択し、領域を再描画します。

[ポリゴン] ツールを使用して、領域を指定することもできます。

画像の領域を作成した後、[送信] を選択して作業内容を保存します。そうしないと、進行中の作業内容は保存されません。 [ポリゴン] ツールを使用した場合、送信時にすべてのポリゴンがマスクに変換されます。

[ラベルの文字]

テキストにタグを付けるときは、ツール バーを使用して次のようにします。

  • テキストのサイズを拡大または縮小する
  • フォントの変更
  • この項目のラベル付けをスキップし、次の項目に移動する

タグを割り当てた後に間違えに気付いた場合は、修正できます。 テキストの下に表示されているラベルの [X] を選択して、タグをクリアします。

3 種類のテキスト プロジェクトがあります。

プロジェクトの種類 説明
多クラス分類 テキスト エントリ全体に 1 つのタグを割り当てます。 テキスト項目ごとに 1 つのタグのみ選択できます。 タグを選択し、[送信] を選択して、次のエントリに移動します。
分類の複数ラベル 各テキスト エントリに 1 つ "以上" のタグを割り当てます。 テキスト項目ごとに複数のタグを選択できます。 適用するタグをすべて選択し、[送信] を選択して、次のエントリに移動します。
名前付きエンティティの認識 各テキスト エントリで異なる単語またはフレーズにタグを付けます。 次のセクションの指示を参照してください。

プロジェクト固有の指示を表示するには、[指示] を選択し、[詳細な指示の表示] に移動します。

単語とフレーズにタグを付ける

プロジェクトが固有表現認識用に設定されている場合は、各テキスト項目で異なる単語またはフレーズにタグを付けます。 テキストにラベルを付けるには:

  1. ラベルを選択するか、適切なラベルに対応する番号を入力します
  2. 単語をダブルクリックするか、マウスを使用して複数の単語を選択します。

Screenshot: Named entity recognition.

ラベルを変更するには、次の方法があります。

  • ラベルを削除し、最初から開始します。
  • 現在の項目の特定のラベルの一部またはすべての値を次のように変更します。
    • ラベル自体を選択すると、そのラベルのすべてのインスタンスが選択されます。
    • このラベルのインスタンスをもう一度選択して、変更しないインスタンスの選択を解除します。
    • 最後に、新しいラベルを選択して、まだ選択されているラベルを変更します。

エントリ内のすべての項目にタグを付けたら、[送信] を選択して、次のエントリに移動します。

しあげ

タグを付けたデータのページを送信すると、Azure によってラベルの付いていない新しいデータが作業キューから割り当てられます。 ラベルの付いていないデータがなくなると、その旨を示すメッセージとともにポータルのホーム ページへのリンクが表示されます。

ラベル付けが完了したら、スタジオの右上隅にある丸で囲まれた自分の画像を選択して、[サインアウト] を選択します。サインアウトしない場合、Azure によってタイムアウトになり、データが別のラベラーに割り当てられます。

次のステップ