モデルを構築およびデプロイするための Azure 機械学習サービス。
AutoML の実行に利用するコンピューティングを開始すると「使用不可」となり、再起動しても改善しないとのこと、承知いたしました。
公開情報を確認したところ、AutoML 実行時の「使用不可」そのものを直接説明した資料は確認できませんでしたが、関連する要因として、少なくとも以下の点が公式ドキュメントで確認できました。
1. コンピューティング インスタンスの OS ディスク空き容量不足
コンピューティング インスタンスについては、ディスク領域不足が開始・再起動時の問題要因となり得ることが示されています。
「ディスク領域が不足する場合は、コンピューティング インスタンスを停止または再起動する前に、ターミナルを使用して少なくとも 5 GB をクリアしてください。」 — コンピューティング インスタンスを管理する - Azure Machine Learning
「ディスク領域が不足する場合は、コンピューティング インスタンスを停止または再起動する前に、ターミナルを使用して少なくとも 1 GB から 2 GB をクリアしてください。」 — コンピューティング先を理解する - Azure Machine Learning
そのため、コンピューティング インスタンスをご利用の場合は、まず OS ディスクの空き容量をご確認いただくことをお勧めいたします。
2. クォータ不足またはリージョン側の容量不足
Azure Machine Learning のコンピューティングについて、クォータは容量保証ではないこと、およびリージョンの使用可能容量によって起動・再起動に影響を受ける場合があることが明記されています。
「クォータは、『容量の保証ではなく』、Azure リソースの『クレジット制限』です。」 — Azure Machine Learning コンピューティング インスタンスを作成する
「SKU のリージョンに容量のクランチがある場合は、コンピューティング インスタンスを再起動できない可能性があります。」 — Azure Machine Learning コンピューティング インスタンスを作成する
「Azure Machine Learning コンピューティングには、コアの数と、サブスクリプション内のリージョンごとに許可される一意のコンピューティング リソースの数の両方に対する既定のクォータ制限があります。」 — リソースとクォータを管理する - Azure Machine Learning
そのため、ご利用リージョンのクォータや、対象 VM サイズの使用可能容量の状況もご確認いただく必要があります。
3. VNet / プライベート エンドポイント / カスタム DNS 構成の影響
Azure Machine Learning ワークスペースをプライベート エンドポイントやカスタム DNSと組み合わせて利用している場合、コンピューティング リソースでジョブが失敗する場合があることが明記されています。
「仮想マシンからワークスペースにアクセスできない場合、または Azure Machine Learning ワークスペースへのプライベート エンドポイントが含まれている仮想ネットワークのコンピューティング リソースでジョブが失敗する場合は、次の手順に従って原因を特定してください。」 — カスタム DNS サーバーを使用する - Azure Machine Learning
「各 nslookup の結果で、Azure Machine Learning ワークスペースへのプライベート エンドポイントの 2 つのプライベート IP アドレスの 1 つが生成される必要があります。そうでない場合は、カスタム DNS ソリューションで何かが正しく構成されていません。」 — カスタム DNS サーバーを使用する - Azure Machine Learning
そのため、ワークスペースが VNet / プライベート エンドポイント / カスタム DNS 配下で構成されている場合は、名前解決やネットワーク構成も確認対象となります。
4. AutoML で使用しているコンピューティング種別の確認
AutoML で利用できるトレーニング先として、以下が示されています。 そのため、今回ご利用中のコンピューティングが「コンピューティング インスタンス」「コンピューティング クラスター」「サーバーレス コンピューティング」のいずれかを確認することが重要です。
「Azure Machine Learning コンピューティング クラスター はい / Azure Machine Learning サーバーレス コンピューティング はい / Azure Machine Learning コンピューティング インスタンス はい (SDK を使用)」 — コンピューティング先を理解する - Azure Machine Learning
以上となります。 上記の点について、確認をお願い致します。