Azure Machine Learning ワークスペースとは

ワークスペースは、Azure Machine Learning の最上位のリソースで、Azure Machine Learning を使用するときに作成するすべての成果物を操作するための一元的な場所を提供します。 ワークスペースには、スクリプトのログ、メトリック、出力、スナップショットなど、すべてのトレーニング実行の履歴が保持されます。 この情報を使用して、最適なモデルを生成するトレーニング実行を判断します。

必要なモデルを作成したら、ワークスペースに登録します。 次に、登録済みのモデルとスコアリング スクリプトを使用して、REST ベースの HTTP エンドポイントとしてオンライン エンドポイントにデプロイします。

分類

  • ワークスペースには、Azure Machine Learning の実行に必要な Python 環境で構成されたクラウド リソースである Azure Machine Learning コンピューティング インスタンスを含めることができます。

  • ユーザー ロールを使用すると、お使いのワークスペースを他のユーザー、チーム、またはプロジェクトと共有できます。

  • コンピューティング ターゲットは、ご自身の実験の実行に使用されます。

  • ワークスペースを作成すると、関連するリソースも自動的に作成されます。

  • ジョブは、ご自身のモデルの構築に使用するトレーニング実行です。 ジョブを実験に整理できます。

  • パイプラインは、お使いのモデルをトレーニングおよび再トレーニングするための再利用可能なワークフローです。

  • データセットは、モデルのトレーニングとパイプラインの作成に使用するデータの管理に役立ちます。

  • デプロイするモデルを作成したら、登録済みモデルを作成します。

  • 登録したモデルとスコアリング スクリプトを使用して、オンライン エンドポイントを作成します。

ワークスペース操作のためのツール

ご自身のワークスペースは、次の方法で操作できます。

ワークスペースを使用した機械学習

機械学習タスクでは、お使いのワークスペースに対する成果物の読み取り/書き込みが行われます。

  • 実験を実行してモデルをトレーニングします - ジョブの実行結果がワークスペースに書き込まれます。
  • 自動 ML を使用してモデルをトレーニングします - トレーニング結果がワークスペースに書き込まれます。
  • ワークスペースでモデルを登録します。
  • モデルをデプロイします - 登録したモデルを使用してデプロイが作成されます。
  • 再利用可能なワークフローを作成して実行します。
  • ジョブ、パイプライン、モデル、デプロイなどの機械学習の成果物を表示します。
  • モデルを追跡および監視します。

ワークスペースの管理

次のワークスペース管理タスクを実行することもできます。

ワークスペース管理タスク ポータル スタジオ Python SDK Azure CLI VS Code
ワークスペースの作成
ワークスペース アクセスの管理
コンピューティング リソースを作成して管理する
コンピューティング インスタンスを作成する

警告

Azure Machine Learning ワークスペースを別のサブスクリプションに移動したり、所有するサブスクリプションを新しいテナントに移動したりすることは、サポートされていません。 エラーの原因になります。

ワークスペースの作成

ワークスペースは、さまざまな方法で作成できます。

注意

ワークスペース名では、大文字と小文字は区別されません。

サブ リソース

これらのサブ リソースは、AzureML ワークスペースで作成される主要なリソースです。

  • VM: AzureML ワークスペースのコンピューティング能力を提供します。モデルのデプロイとトレーニングに不可欠な要素です。
  • ロード バランサー: コンピューティング インスタンスおよびクラスターが停止している場合でもトラフィックを管理するために、コンピューティング インスタンスとコンピューティング クラスターごとにネットワーク ロード バランサーが作成されます。
  • 仮想ネットワーク: これらは、Azure リソースが互いに通信したり、インターネットやその他のオンプレミス ネットワークと通信したりするために役立ちます。
  • 帯域幅: リージョン間のすべてのアウトバウンド データ転送をカプセル化します。

関連付けられているリソース

新しいワークスペースを作成すると、ワークスペースによって使用される複数の Azure リソースが自動的に作成されます。

  • Microsoft Azure Storage アカウント:ワークスペースの既定のデータストアとして使用されます。 Azure Machine Learning コンピューティングインスタンスで使用される Jupyter ノートブックもここに保存されます。

    重要

    既定では、ストレージ アカウントは汎用 v1 アカウントです。 ワークスペースの作成後に、これを汎用 v2 にアップグレードすることができます。 汎用 v2 にアップグレードした後は、ストレージ アカウントで階層型名前空間を有効にしないでください。

    既存の Azure Storage アカウントを使用する場合は、種類 BlobStorage や Premium アカウント (Premium_LRS と Premium_GRS) であってはいけません。 また、階層的名前空間 (Azure Data Lake Storage Gen2 で使用されます) を含めることもできません。 ワークスペースの "既定の" ストレージ アカウントでは、Premium Storage も階層型名前空間もサポートされていません。 "既定以外" のストレージ アカウントでは、Premium Storage または階層型名前空間を使用できます。

  • Azure Container Registry: 以下のコンポーネントに対して使用される Docker コンテナーを登録します。

    コストを最小限に抑えるために、ACR は、イメージが必要になるまでは遅延読み込みされます。

    注意

    サブスクリプションの設定で、配下のリソースにタグを追加することが要求されている場合、Azure Machine Learning によって作成される Azure Container Registry (ACR) でエラーが発生します。Microsoft が ACR にタグを設定することはできないためです。

  • Azure Application Insights: 監視と診断の情報を格納します。 詳しくは、「オンライン エンドポイントを監視する」をご覧ください。

    注意

    必要に応じて、クラスターの作成後に Application Insights インスタンスを削除できます。 それを削除すると、ワークスペースから収集される情報が限定され、問題のトラブルシューティングが困難になる可能性があります。 ワークスペースによって作成された Application Insights インスタンスを削除した場合、ワークスペースを削除して再作成せずに再作成することはできません。

  • Azure Key Vault:コンピューティング先で使用されるシークレット、およびワークスペースで必要な他の機密情報を格納します。

注意

代わりに、ARM テンプレートを使用して Python SDK または Azure Machine Learning CLI でワークスペースを作成するときに、既存の Azure リソース インスタンスを使用することができます。

次のステップ

組織の要件に合わせてワークスペースを計画する方法の詳細については、Azure Machine Learning の整理とセットアップに関するページを参照してください。

Azure Machine Learning の利用を開始するには、以下を参照してください。