スタジオでジョブを監視および分析する
Azure Machine Learning スタジオを使って、トレーニングと実験のためにジョブを監視、整理、追跡できます。 ML ジョブ履歴は、説明可能かつ反復可能な ML 開発プロセスの重要な部分です。
この記事では、次のタスクの手順について説明します。
- ジョブの表示名の追加。
- カスタム ビューの作成。
- ジョブの説明の追加。
- ジョブのタグ付けおよび検索。
- ジョブ履歴に対する検索の実行。
- ジョブのキャンセルまたは失敗。
- 電子メール通知によるジョブ状態の監視。
- ジョブ リソースの監視 (プレビュー)
ヒント
- Azure Machine Learning SDK v1 または CLI v1 の使用方法については、ジョブを追跡、監視、分析する方法 (v1) に関するページを参照してください。
- CLI または SDK v2 からのトレーニング ジョブの監視については、「MLflow と CLI (v2) を使用して実験を追跡する」を参照してください。
- Azure Machine Learning service および関連する Azure サービスの監視の詳細については、Azure Machine Learning を監視する方法に関する記事を参照してください。
オンライン エンドポイントにデプロイされたモデルの監視に関する情報を探す場合は、オンライン エンドポイントの監視に関するページを参照してください。
前提条件
次のものが必要です。
- Azure Machine Learning を使用するには、Azure サブスクリプションが必要です。 Azure サブスクリプションをお持ちでない場合は、開始する前に無料アカウントを作成してください。 無料版または有料版の Azure Machine Learning をお試しください。
- Azure Machine Learning ワークスペースが必要です。 ワークスペースは、CLI (v2) のインストール、設定、使用に関するページで作成されます。
ジョブの表示名
ジョブの表示名は、ジョブに対して指定できる省略可能かつカスタマイズ可能な名前です。 ジョブの表示名を編集するには:
[ジョブ] リストに移動します。
編集するジョブを選択します。
[編集] ボタンを選択して、ジョブの表示名を編集します。
カスタム ビュー
自分のジョブをスタジオで表示するには、次のようにします。
[ジョブ] タブに移動します。
実験のすべてのジョブを表示するには、[All experiments](すべての実験) を選択し、ワークスペースで送信したすべてのジョブを表示するには、[すべてのジョブ] を選択します。
[すべてのジョブ] ページでは、タグ、実験、コンピューティング ターゲットなどでジョブのリストをフィルター処理し、自分の作業を整理したり、範囲を絞り込んだりすることができます。
このページでは、比較するジョブを選択したり、グラフを追加したり、フィルターを適用して、カスタマイズすることが可能です。 これらの変更はカスタム ビューとして保存できるので、簡単に作業に戻ることができます。 ワークスペースのアクセス許可を持つユーザーは、カスタム ビューを編集、または表示できます。 また、 [共有ビュー] を選択すると、カスタム ビューをチームメンバーと共有して、連携を強化できます。
ジョブ ログを表示するには、特定のジョブを選択し、自分のジョブの診断とエラーのログを [出力 + ログ] タブから確認します。
ジョブの説明
ジョブの説明をジョブに追加して、より多くのコンテキストと情報をジョブに提供できます。 また、ジョブのリストでこれらの説明を検索し、ジョブのリストの列としてジョブの説明を追加することもできます。
自分のジョブの [ジョブの詳細] ページに移動し、編集または鉛筆アイコンを選択して、自分のジョブの説明を追加、編集、または削除します。 お使いの既存のカスタム ビューまたは新しいカスタム ビューに変更を保存すると、この変更をジョブのリストに保存できます。 ジョブの説明には、下に示すように、イメージを埋め込んだり、ディープ リンクを設定したりすることができる Markdown 形式がサポートされています。
ジョブのタグ付けおよび検索
Azure Machine Learning では、ジョブの整理にプロパティとタグを使用したり、自分のジョブに対し重要な情報をクエリしたりできます。
タグを編集する
スタジオからジョブのタグを追加、編集、または削除できます。 自分のジョブの [ジョブの詳細] ページに移動し、編集または鉛筆アイコンを選択して、自分のジョブのタグを追加、編集、または削除します。 ジョブのリストのページから、これらのタグを検索したり、フィルター処理したりすることもできます。
クエリ プロパティおよびタグ
特定のプロパティとタグに一致するジョブのリストが返されるように、実験内のジョブをクエリできます。
特定のジョブを検索するには、[すべてのジョブ] リストに移動します。 ここでは、次の 2 つの選択肢があります。
[フィルターの追加] ボタンを使用して、タグへのフィルター適用を選択し、ジョブに割り当てられたタグでジョブをフィルター処理します。
OR検索バーを使用して、ジョブ状態、説明、実験名、送信者名などのジョブ メタデータを検索することにより、ジョブをすばやく見つけます。
ジョブのキャンセルまたは失敗
間違いに気付いた場合、またはジョブの完了に時間がかかりすぎている場合は、ジョブをキャンセルできます。
スタジオでジョブをキャンセルするには、次の手順を使用します。
[ジョブ] または [パイプライン] セクションで、実行中のパイプラインに移動します。
キャンセルするパイプラインのジョブ番号を選択します。
ツール バーで、 [キャンセル] を選択します。
電子メール通知によるジョブ状態の監視
Azure portalの左側のナビゲーション バーで、 [監視] タブを選択します。
[診断設定] を選択し、 [+ 診断設定の追加] を選択します。
[診断設定] の
- [カテゴリの詳細] で、 [AmlRunStatusChangedEvent] を選択します。
- [宛先の詳細] で、[Log Analytics ワークスペースに送信する] を選び、[サブスクリプション] と [Log Analytics ワークスペース] を指定します。
Note
Azure Log Analytics ワークスペースは、Azure Machine Learning service ワークスペースとは異なる種類の Azure Resource です。 そのリストにオプションがない場合は、Log Analytics ワークスペースを作成することができます。
[ログ] タブで、新しい警告ルールを追加します。
Azure Monitor を使用してログ アラートを作成および管理する方法に関するページを参照してください。
次のステップ
- 自分の実験のメトリックのログを記録する方法の詳細については、トレーニング ジョブの実行中におけるメトリックのログ記録に関するページを参照してください。
- Azure Machine Learning からリソースとログを監視する方法については、「Azure Machine Learning の監視」を参照してください。
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示