スタジオでジョブを監視および分析する

Azure Machine Learning スタジオを使って、トレーニングと実験のためにジョブを監視、整理、追跡できます。 ML ジョブ履歴は、説明可能かつ反復可能な ML 開発プロセスの重要な部分です。

この記事では、次のタスクの手順について説明します。

  • ジョブの表示名の追加。
  • カスタム ビューの作成。
  • ジョブの説明の追加。
  • ジョブのタグ付けおよび検索。
  • ジョブ履歴に対する検索の実行。
  • ジョブのキャンセルまたは失敗。
  • 電子メール通知によるジョブ状態の監視。
  • ジョブ リソースの監視 (プレビュー)

ヒント

オンライン エンドポイントにデプロイされたモデルの監視に関する情報を探す場合は、オンライン エンドポイントの監視に関するページを参照してください。

前提条件

次のものが必要です。

ジョブの表示名

ジョブの表示名は、ジョブに対して指定できる省略可能かつカスタマイズ可能な名前です。 ジョブの表示名を編集するには:

  1. [ジョブ] リストに移動します。

  2. 編集するジョブを選択します。

    [ジョブ] リストのスクリーンショット。

  3. [編集] ボタンを選択して、ジョブの表示名を編集します。

    表示名を編集する方法を示したスクリーンショット。

カスタム ビュー

自分のジョブをスタジオで表示するには、次のようにします。

  1. [ジョブ] タブに移動します。

  2. 実験のすべてのジョブを表示するには、[All experiments](すべての実験) を選択し、ワークスペースで送信したすべてのジョブを表示するには、[すべてのジョブ] を選択します。

[すべてのジョブ] ページでは、タグ、実験、コンピューティング ターゲットなどでジョブのリストをフィルター処理し、自分の作業を整理したり、範囲を絞り込んだりすることができます。

  1. このページでは、比較するジョブを選択したり、グラフを追加したり、フィルターを適用して、カスタマイズすることが可能です。 これらの変更はカスタム ビューとして保存できるので、簡単に作業に戻ることができます。 ワークスペースのアクセス許可を持つユーザーは、カスタム ビューを編集、または表示できます。 また、 [共有ビュー] を選択すると、カスタム ビューをチームメンバーと共有して、連携を強化できます。

  2. ジョブ ログを表示するには、特定のジョブを選択し、自分のジョブの診断とエラーのログを [出力 + ログ] タブから確認します。

    カスタム ビューを作成する方法を示したスクリーンショット。

ジョブの説明

ジョブの説明をジョブに追加して、より多くのコンテキストと情報をジョブに提供できます。 また、ジョブのリストでこれらの説明を検索し、ジョブのリストの列としてジョブの説明を追加することもできます。

自分のジョブの [ジョブの詳細] ページに移動し、編集または鉛筆アイコンを選択して、自分のジョブの説明を追加、編集、または削除します。 お使いの既存のカスタム ビューまたは新しいカスタム ビューに変更を保存すると、この変更をジョブのリストに保存できます。 ジョブの説明には、下に示すように、イメージを埋め込んだり、ディープ リンクを設定したりすることができる Markdown 形式がサポートされています。

ジョブの説明の作成方法を示すスクリーンショット。

ジョブのタグ付けおよび検索

Azure Machine Learning では、ジョブの整理にプロパティとタグを使用したり、自分のジョブに対し重要な情報をクエリしたりできます。

  • タグを編集する

    スタジオからジョブのタグを追加、編集、または削除できます。 自分のジョブの [ジョブの詳細] ページに移動し、編集または鉛筆アイコンを選択して、自分のジョブのタグを追加、編集、または削除します。 ジョブのリストのページから、これらのタグを検索したり、フィルター処理したりすることもできます。

    ジョブのタグを追加、編集、削除する方法を示したスクリーンショット。

  • クエリ プロパティおよびタグ

    特定のプロパティとタグに一致するジョブのリストが返されるように、実験内のジョブをクエリできます。

    特定のジョブを検索するには、[すべてのジョブ] リストに移動します。 ここでは、次の 2 つの選択肢があります。

    1. [フィルターの追加] ボタンを使用して、タグへのフィルター適用を選択し、ジョブに割り当てられたタグでジョブをフィルター処理します。

      OR

    2. 検索バーを使用して、ジョブ状態、説明、実験名、送信者名などのジョブ メタデータを検索することにより、ジョブをすばやく見つけます。

ジョブのキャンセルまたは失敗

間違いに気付いた場合、またはジョブの完了に時間がかかりすぎている場合は、ジョブをキャンセルできます。

スタジオでジョブをキャンセルするには、次の手順を使用します。

  1. [ジョブ] または [パイプライン] セクションで、実行中のパイプラインに移動します。

  2. キャンセルするパイプラインのジョブ番号を選択します。

  3. ツール バーで、 [キャンセル] を選択します。

電子メール通知によるジョブ状態の監視

  1. Azure portalの左側のナビゲーション バーで、 [監視] タブを選択します。

  2. [診断設定] を選択し、 [+ 診断設定の追加] を選択します。

    電子メール通知の診断設定のスクリーンショット

  3. [診断設定] の

    1. [カテゴリの詳細] で、 [AmlRunStatusChangedEvent] を選択します。
    2. [宛先の詳細] で、[Log Analytics ワークスペースに送信する] を選び、[サブスクリプション][Log Analytics ワークスペース] を指定します。

    Note

    Azure Log Analytics ワークスペースは、Azure Machine Learning service ワークスペースとは異なる種類の Azure Resource です。 そのリストにオプションがない場合は、Log Analytics ワークスペースを作成することができます。

    電子メール通知を保存する場所

  4. [ログ] タブで、新しい警告ルールを追加します。

    新しいアラート ルール

  5. Azure Monitor を使用してログ アラートを作成および管理する方法に関するページを参照してください。

次のステップ