チュートリアル: AutoML と Python を使用して物体検出モデルをトレーニングする

適用対象:Azure CLI ML 拡張機能 v2 (現行)Python SDK azure-ai-ml v2 (現行)

このチュートリアルでは、Azure Machine Learning CLI 拡張機能 v2 または Azure Machine Learning Python SDK v2 で Azure Machine Learning の自動 ML を使って、物体検出モデルをトレーニングする方法について説明します。このオブジェクト検出モデルは、画像に缶、箱、牛乳瓶、水のボトルなどのオブジェクトが含まれているかどうかを識別します。

自動 ML は、トレーニングデータと構成設定を受け取り、さまざまな特徴量の正規化/標準化の方法、モデル、およびハイパーパラメーター設定の組み合わせを自動的に反復処理し、最適なモデルに到達します。

このチュートリアルでは、Python SDK を使用してコードを記述し、次のタスクを学習します。

データをダウンロードして変換する
自動機械学習オブジェクト検出モデルをトレーニングする
モデルのハイパーパラメーター値を指定する
ハイパーパラメータースイープを実行する
モデルをデプロイする
検出を視覚化する

前提条件

Azure Machine Learning を使用するには、ワークスペースが必要です。まだない場合は、作業を開始するために必要なリソースの作成を完了し、ワークスペースを作成してその使用方法の詳細を確認してください。

重要

Azure Machine Learning ワークスペースがマネージド仮想ネットワークを使用して構成されている場合、パブリック Python パッケージリポジトリへのアクセスを許可するアウトバウンド規則の追加が必要になることがあります。詳細については、「シナリオ: パブリック機械学習パッケージにアクセスする」を参照してください。
この機能では、Python 3.9 または 3.10 がサポートされています
* odFridgeObjects.zip データファイルをダウンロードし、展開します。このデータセットには Pascal VOC 形式で注釈が付けられており、各画像は xml ファイルに対応しています。各 xml ファイルには、対応する画像ファイルが配置されている場所の情報と、境界ボックスとオブジェクトラベルの情報が含まれています。このデータを使うには、まずノートブックのダウンロードしたデータを JSONL に変換する方法に関するセクションで説明されているように、必要な JSONL 形式に変換する必要があります。
追加のインストールを行わずにこのチュートリアルを行うには、コンピューティングインスタンスを使ってください。 (コンピューティングインスタンスを作成する方法に関する記事を参照)。または、独自のローカル環境を使うには CLI/SDK をインストールします。
- Azure CLI
- Python SDK
適用対象:Azure CLI ml 拡張機能 v2 (現行)

このチュートリアルは、GitHub の azureml-examples リポジトリでも利用できます。独自のローカル環境で実行する場合:
- CLI (v2) をインストールして設定します。必ず、ml 拡張機能をインストールしてください。
適用対象: Python SDK azure-ai-ml v2 (現行)

このチュートリアルは、GitHub の azureml-examples リポジトリでも利用できます。独自のローカル環境で実行する場合:
- 次のコマンドを使用して、Azure Machine Learning Python SDK v2 をインストールします。
  - 以前のプレビューバージョンをアンインストールします。
```
pip uninstall azure-ai-ml
```
  - Azure Machine Learning Python SDK v2 をインストールします。
```
pip install azure-ai-ml azure-identity
```
  注
  
  Python 3.6 と 3.7 のみ、Computer Vision タスクの自動 ML のサポートと互換性があります。

コンピューティング先のセットアップ

注

サーバーレスコンピューティング (プレビュー) を試すには、このステップをスキップして、「実験のセットアップ」に進んでください。

最初に、自動 ML モデルのトレーニングに使用するコンピューティング先を設定する必要があります。画像タスクの自動 ML モデルには、GPU SKU が必要です。

このチュートリアルでは、NCsv3 シリーズ (V100 GPU を使用) を使用します。この種類のコンピューティング先では、トレーニングを高速化するために複数の GPU が利用されるためです。さらに、複数のノードを設定すると、モデルのハイパーパラメーターをチューニングするときに並列処理を利用できます。

次のコードを実行すると、サイズが Standard_NC24s_v3 で 4 つのノードを持つ GPU コンピューティングが作成されます。

次の方法で共有

チュートリアル: AutoML と Python を使用して物体検出モデルをトレーニングする

前提条件

コンピューティング先のセットアップ

実験のセットアップ

入力データを視覚化する

データをアップロードして MLTable を作成する

オブジェクト検出実験を構成する

画像タスクの自動ハイパーパラメーター スイープ (AutoMode)

画像タスクの手動ハイパーパラメーター スイープ

ジョブの制限

モデルを登録して展開する

最適な試行を取得する

モデルを登録する

オンライン エンドポイントを構成する

エンドポイントを作成する

オンライン デプロイを構成する

配置を作成する

トラフィックを更新する:

展開をテスト

検出を視覚化する

リソースをクリーンアップする

次のステップ

フィードバック

その他のリソース

画像タスクの自動ハイパーパラメータースイープ (AutoMode)

画像タスクの手動ハイパーパラメータースイープ

オンラインエンドポイントを構成する

オンラインデプロイを構成する