Azure Machine Learning について説明し、これを Azure Synapse Analytics ワークスペースと統合する方法について説明する

完了

Azure Machine Learning は、従来の ML からディープ ラーニング、教師あり学習と教師なし学習まで、あらゆる種類の機械学習に使用できます。 SDK を使用して Python または R のコードを記述するか、または Studio でのコード不要 (またはローコード) オプションを使用するかにかかわらず、Azure Machine Learning ワークスペースで機械学習およびディープ ラーニング モデルを構築、トレーニング、追跡できます。

ローカル コンピューターでトレーニングを開始し、その後、クラウドにスケールアウトできます。 また、このサービスは、PyTorch、TensorFlow、scikit-learn、Ray RLlib など、ディープ ラーニングや強化のための一般的なオープン ソース ツールと連携します。

大まかに言えば、一般的なデータ サイエンス プロセスには次の手順が含まれます。

  • ビジネスの把握
  • データの取得と理解
  • モデリング
  • モデルのデプロイとスコアリング

データ サイエンス プロセスの各ステップでは、次に示すツールを使用して Azure Synapse と Azure Machine Learning の機能を統合すると有用です。

  • データ インジェストとデータ オーケストレーション パイプライン: これを使用すると、データにアクセスして機械学習に使用できる形式に変換するためのデータ パイプラインをすばやく構築できます。 Synapse のデータ パイプラインについて詳しくは、こちらをご覧ください。
  • Synapse Spark プール: Azure Synapse では、PySpark/Python、Scala、.NET などのツールを使用して、Apache Spark プールで機械学習モデルのトレーニングを実行できます。
  • Azure Machine Learning の自動 ML:Azure Synapse Notebooks から Azure Machine Learning とシームレスに統合できるため、ユーザーは Microsoft Entra パススルー認証を使用して Synapse で自動 ML を簡単に利用できます。
  • T-SQL PREDICT 関数: Synapse SQL プールで T-SQL PREDICT を使用すると、データが存在する場所で直接予測を実行できます。 この強力でスケーラブルな関数を使用すると、データ ウェアハウスからデータを移動せずにデータを強化することができます。

Azure Machine Learning ワークスペースと Synapse Analytics ワークスペースとの間の接続は、Microsoft Entra アプリケーションとサービス プリンシパルに依存します。 サービス プリンシパルには、Azure Machine Learning ワークスペースの "共同作成者" ロールが付与されている必要があります。 サービスプリンシパルの準備が整ったら、それを使用して、Synapse Analytics で Azure Machine Learning のリンクされたサービスを作成できます。 次のセクションでは、ステップ バイ ステップの演習を行うことができます。