Share via


自動 ML 実験のトラブルシューティング

適用対象:Azure CLI ml extension v2 (現行)Python SDK azure-ai-ml v2 (現行)

このガイドでは、自動機械学習体験における問題を特定し、解決する方法について説明します。

Studio のイメージと NLP を対象に自動 ML の問題を解決する

イメージと NLP に関連して自動 ML のジョブ エラーが発生した場合、そのエラーを次の手順で理解できます。

  1. Studio の UI では、自動 ML ジョブにエラーの理由を示すメッセージが表示されるはずです。
  2. 詳細については、この自動 ML ジョブの子ジョブに関するページを参照してください。 この子実行は HyperDrive ジョブです。
  3. [試験] タブで、この HyperDrive 実行に対して行われたすべての試験を確認できます。
  4. 失敗した試験ジョブのページに移動します。
  5. [概要] タブの [状態] セクションにそのジョブのエラー メッセージがあるはずです。その中でエラーの理由が示されています。 エラーの詳細については、[詳細を参照してください] を選択してください。
  6. さらに、[出力とログ] タブの [std_log.txt] を見ると、詳しいログと例外トレースを確認できます。

自動 ML 実行で試験にパイプライン実行が使用される場合、次の手順でエラーを理解できます。

  1. 上記の手順 1 から 4 までを実行し、失敗した試験ジョブ行を特定します。
  2. この実行でパイプライン実行を確認できるはずです。パイプライン内のエラー ノードには赤い印が付いています。 Diagram that shows a failed pipeline job.
  3. パイプライン内のエラー ノードを選択します。
  4. [概要] タブの [状態] セクションにそのジョブのエラー メッセージがあるはずです。その中でエラーの理由が示されています。 エラーの詳細については、[詳細を参照してください] を選択してください。
  5. [出力とログ] タブの [std_log.txt] を見ると、詳しいログと例外トレースを確認できます。

次のステップ