次の方法で共有


クラウド規模の分析のためのデータ製品としての Azure Machine Learning

Azure Machine Learning は、機械学習モデルとワークフローの作成、操作、使用に関するヘルプを含め、機械学習のライフサイクルを最初から最後まで管理するための統合プラットフォームです。 このサービスには、次のような利点があります。

  • この機能では、作成者が実験の管理、データへのアクセス、ジョブの追跡、ハイパーパラメーターの調整、ワークフローの自動化を支援することで、生産性を向上させることができます。

  • モデルの説明、再現、監査、DevOps との統合に加えて、豊富なセキュリティ制御モデルを備えたモデルの能力は、ガバナンスとコンプライアンスの要件を満たすためにオペレーターをサポートできます。

  • マネージド推論機能と Azure コンピューティングおよびデータ サービスとの堅牢な統合は、サービスの使用方法を簡素化するのに役立ちます。

Azure Machine Learning では、データ サイエンスライフサイクルのすべての側面がカバーされます。 モデル デプロイへのデータストアとデータセットの登録について説明します。 従来の機械学習からディープ ラーニングまで、あらゆる種類の機械学習に使用できます。 教師あり学習と教師なし学習が含まれます。 Python、R コード、またはデザイナーなどのゼロ コードまたはロー コード オプションのどちらを使用する場合でも、Azure Machine Learning ワークスペースで正確な機械学習とディープ ラーニング モデルを構築、トレーニング、追跡できます。

Azure Machine Learning、Azure プラットフォーム、および Azure AI サービスは連携して、機械学習のライフサイクルを管理できます。 機械学習の専門家は、Azure Synapse Analytics、Azure SQL Database、または Microsoft Power BI を使用してデータの分析を開始し、プロトタイプ作成、実験の管理、運用化のために Azure Machine Learning に移行できます。 Azure ランディング ゾーンでは、Azure Machine Learning は データ製品と見なすことができます。

クラウド規模の分析での Azure Machine Learning

クラウド導入フレームワーク (CAF) ランディング ゾーン基盤、クラウドスケール分析データ ランディング ゾーン、および Azure Machine Learning の構成により、新しい機械学習ワークロードを繰り返しデプロイしたり、既存のワークロードを移行したりできる構成済みの環境を持つ機械学習の専門家が設定されます。 これらの機能は、機械学習の専門家が時間の機敏性と価値を高めるのに役立ちます。

次の設計原則は、Azure Machine Learning Azure ランディング ゾーンの実装をガイドします。

  • 高速データ アクセス: ランディング ゾーンのストレージ コンポーネントを Azure Machine Learning ワークスペースのデータ ストアとして事前構成します。

  • 有効なコラボレーション: プロジェクト別にワークスペースを整理し、ランディング ゾーン リソースのアクセス管理を一元化して、データ エンジニアリング、データ サイエンス、機械学習の専門家が連携できるようにします。

  • セキュリティで保護された実装: 各デプロイの既定値として、ベスト プラクティスに従い、ネットワークの分離、ID、アクセス管理を使用してデータ資産をセキュリティで保護します。

  • セルフサービス: 機械学習の専門家は、新しいプロジェクト リソースをデプロイするオプションを調べることで、機敏性と組織性を高めることができます。

  • データ管理とデータ消費の間の懸念事項の分離: ID パススルーは、Azure Machine Learning とストレージの既定の認証の種類です。

  • データ アプリケーションの高速化 (ソースアライン): Azure Data Factory、Azure Synapse Analytics、および Databricks ランディング ゾーンは、Azure Machine Learning にリンクするように事前構成できます。

  • 可観測性: 中央ログと参照の構成は、環境の監視に役立ちます。

実装の概要

このセクションでは、クラウド規模の分析に固有の構成をお勧めします。 これは、Azure Machine Learning のドキュメントとクラウド導入フレームワークのベスト プラクティスを補完します。

ワークスペースの組織とセットアップ

ワークロードに必要な機械学習ワークスペースの数と、デプロイするすべてのランディング ゾーンにデプロイできます。 次の推奨事項は、セットアップに役立ちます。

  • プロジェクトごとに少なくとも 1 つの機械学習ワークスペースをデプロイします。

  • 機械学習プロジェクトのライフサイクルに応じて、1 つの開発 (開発) ワークスペースをデプロイしてユース ケースのプロトタイプを作成し、早い段階でデータを探索します。 継続的な実験、テスト、デプロイが必要な作業の場合は、ステージングワークスペースと運用ワークスペースをデプロイします。

  • データ ランディング ゾーン内の開発、ステージング、運用ワークスペースに複数の環境が必要な場合は、各環境が同じ運用データ ランディング ゾーンに配置されるため、データの重複を回避することをお勧めします。

データ ランディング ゾーンの既定のリソース構成ごとに、Azure Machine Learning サービスは、次の構成と依存リソースを含む専用リソース グループにデプロイされます。

  • Azure Key Vault
  • アプリケーションインサイト
  • Azure Container Registry(アジュール コンテナ レジストリ)
  • Azure Machine Learning を使用して Azure Storage アカウントに接続し、Microsoft Entra ID ベースの認証を使用して、ユーザーがアカウントに接続できるようにします。
  • 診断ログはワークスペースごとに設定され、エンタープライズ規模で中央の Log Analytics リソースに構成されます。これは、Azure Machine Learning ジョブの正常性とリソースの状態をランディング ゾーン内およびランディング ゾーン間で一元的に分析するのに役立ちます。
  • Azure Machine Learning のリソースと依存関係の詳細については、「 Azure Machine Learning ワークスペースとは」 を参照してください。

データ ランディング ゾーン コア サービスとの統合

データ ランディング ゾーンには、 プラットフォーム サービス レイヤーにデプロイされる既定のサービス セットが付属しています。 これらのコア サービスは、Azure Machine Learning がデータ ランディング ゾーンにデプロイされるときに構成できます。

  • Azure Synapse Analytics ワークスペースまたは Databricks ワークスペースをリンクされたサービスとして接続して、データを統合し、ビッグ データを処理します。

  • 既定では、Data Lake サービスはデータ ランディング ゾーンにプロビジョニングされ、Azure Machine Learning 製品のデプロイには、これらのストレージ アカウントに事前構成された接続 (データ ストア) が付属しています。

Azure Machine Learning のデータ製品分析の概要。

ネットワーク接続

Azure ランディング ゾーンに Azure Machine Learning を実装するためのネットワークは、Azure Machine Learning と CAF ネットワークのベスト プラクティスに関するセキュリティのベスト プラクティスを使用して設定されます。 これらのベスト プラクティスには、次の構成が含まれます。

  • Azure Machine Learning と依存リソースは、Private Link エンドポイントを使用するように構成されます。
  • マネージド コンピューティング リソースは、プライベート IP アドレスでのみデプロイされます。
  • Azure Machine Learning パブリック 基本イメージ リポジトリと Azure Artifacts などのパートナー サービスへのネットワーク接続は、ネットワーク レベルで構成できます。

ID およびアクセス管理

Azure Azure Machine Learning を使用してユーザー ID とアクセスを管理する場合は、次の推奨事項を検討してください。

  • Azure Machine Learning のデータ ストアは、資格情報または ID ベースの認証を使用するように構成できます。 Azure Data Lake Storage Gen2 でアクセス制御とデータ レイク構成を使用する場合は、ID ベースの認証を使用するようにデータ ストアを構成します。これにより、Azure Machine Learning はストレージのユーザー アクセス許可を最適化できます。

  • Microsoft Entra グループを使用して、ストレージリソースと機械学習リソースのユーザーアクセス許可を管理します。

  • Azure Machine Learning では、 アクセス制御にユーザー割り当てマネージド ID を 使用し、Azure Container Registry、Key Vault、Azure Storage、Application Insights へのアクセスの範囲を制限できます。

  • Azure Machine Learning で作成されたマネージド コンピューティング クラスターにユーザー割り当てマネージド ID を作成します。

セルフサービスによるインフラストラクチャのプロビジョニング

Azure Machine Learning のポリシーを使用して、セルフサービスを有効にして管理できます。 次の表に、Azure Machine Learning をデプロイするときの既定のポリシーのセットを示します。 詳細については、 Azure Machine Learning の Azure Policy 組み込みポリシー定義に関するページを参照してください。

ポリシー タイプ リファレンス
Azure Machine Learning ワークスペースでは、Azure Private Link を使用する必要があります。 組み込み Azure portal で表示する
Azure Machine Learning ワークスペースでは、ユーザー割り当てマネージド ID を使用する必要があります。 組み込み Azure portal で表示する
[プレビュー]: 指定された Azure Machine Learning コンピューティングに対して許可されるレジストリを構成します。 組み込み Azure portal で表示する
プライベート エンドポイントを使用して Azure Machine Learning ワークスペースを構成します。 組み込み Azure portal で表示する
ローカル認証方法を無効にするように機械学習コンピューティングを構成します。 組み込み Azure portal で表示する
Append-machinelearningcompute-setupscriptscreationscript カスタム (CAF ランディング ゾーン) GitHub で表示
拒否-機械学習-hbiワークスペース カスタム (CAF ランディング ゾーン) GitHub で表示
vnetの背後で機械学習のパブリックアクセスを拒否する カスタム (CAF ランディング ゾーン) GitHub で表示
Deny-machinelearning-AKS カスタム (CAF ランディング ゾーン) GitHub で表示
Deny-machinelearningcompute-subnetid カスタム (CAF ランディング ゾーン) GitHub で表示
Deny-machinelearningcompute-vmsize カスタム (CAF ランディング ゾーン) GitHub で表示
機械学習コンピュータクラスターのリモートログインポートの公開アクセスを拒否する カスタム (CAF ランディング ゾーン) GitHub で表示
Since this is likely a technical command, there's no need for changes unless further context suggests otherwise. カスタム (CAF ランディング ゾーン) GitHub で表示

環境を管理するための推奨事項

クラウド規模の分析データランディング ゾーンでは、反復可能なデプロイの参照実装の概要が示されています。これは、管理可能で管理可能な環境を設定するのに役立ちます。 Azure Machine Learning を使用して環境を管理する場合は、次の推奨事項を検討してください。

  • Microsoft Entra グループを使用して、機械学習リソースへのアクセスを管理します。

  • 中央監視ダッシュボードを発行して、機械学習のパイプラインの正常性、コンピューティング使用率、クォータ管理を監視します。

  • 従来、組み込みの Azure ポリシーを使用していて、追加のコンプライアンス要件を満たす必要がある場合は、ガバナンスとセルフサービスを強化するためのカスタム Azure ポリシーを構築します。

  • 研究開発コストを追跡するには、ユース ケースの調査の初期段階で、ランディング ゾーンに 1 つの機械学習ワークスペースを共有リソースとしてデプロイします。

Von Bedeutung

運用環境レベルのモデル トレーニングには Azure Machine Learning クラスターを使用し、運用グレードのデプロイには Azure Kubernetes Service (AKS) を使用します。

ヒント

データ サイエンス プロジェクトには Azure Machine Learning を使用します。 サブサービスと機能を備えたエンドツーエンドのワークフローをカバーし、プロセスを完全に自動化することができます。

次のステップ

Data Product Analytics テンプレートとガイダンスを使用して Azure Machine Learning をデプロイし、Azure Machine Learning のドキュメントとチュートリアルを参照してソリューションの構築を開始します。