MLflow と Azure Machine Learning を使用した Azure Synapse Analytics ML 実験の追跡

[アーティクル]
04/04/2023

この記事では、Azure Synapse Analytics ワークスペースで作業しているときに MLflow が Azure Machine Learning に接続できるようにする方法について説明します。この構成を、追跡、モデル管理、モデルデプロイに利用できます。

MLflow は、機械学習の実験のライフサイクルを管理するためのオープンソースライブラリです。 MLflow Tracking は、トレーニング実行のメトリックとモデル成果物のログ記録と追跡を行う、MLflow のコンポーネントです。 MLflow の詳細については、次を参照してください。

MLflow プロジェクトを Azure Machine Learning でトレーニングする場合は、「MLflow プロジェクトと Azure Machine Learning を使用して ML モデルをトレーニングする (プレビュー)」を参照してください。

前提条件

ライブラリのインストール

Azure Synapse Analytics の専用クラスターにライブラリをインストールするには:

実験に必要なパッケージを含む requirements.txt ファイルを作成しますが、次のパッケージも含まれていることを確認します。

requirements.txt
```
mlflow
azureml-mlflow
azure-ai-ml
```
Azure Analytics ワークスペースポータルに移動します。
[管理] タブに移動し、[Apache Spark プール] を選択します。
クラスター名の横にある 3 つのドットをクリックし、[パッケージ] を選択します。
[要件ファイル] セクションで、[アップロード] をクリックします。
requirements.txt ファイルをアップロードします。
クラスターが再起動するまで待ちます。

MLflow を使用して実験を追跡する

Azure Synapse Analytics は、MLflow を使用して Azure Machine Learning ワークスペースで実験を追跡するように構成できます。 Azure Machine Learning には、実験、モデル、デプロイのライフサイクル全体を管理するための一元化されたリポジトリが用意されています。これには、Azure Machine Learning のデプロイオプションを使って、より簡単にデプロイへのパスを有効にするという利点もあります。

Azure Machine Learning に接続された MLflow を使用するようにノートブックを構成する

実験の一元化されたリポジトリとして Azure Machine Learning を使用するには、MLflow を利用できます。作業している各ノートブックで、使用するワークスペースを指す追跡 URI を構成する必要があります。次の例では、これが行われる方法を示します。

追跡 URI を構成する

ワークスペースの追跡 URI を取得します。
- Azure CLI
- Python
- [スタジオ](#tab/azure-studio)
- 手動
適用対象: Azure CLI ML 拡張機能 v2 (現行)
1. ログインとワークスペースの構成:
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location> 
```
2. az ml workspace コマンドを使って追跡 URI を取得できます。
```
az ml workspace show --query mlflow_tracking_uri
```
適用対象: Python SDK azure-ai-ml v2 (現行)

Azure ML MLflow 追跡 URI は、Azure Machine Learning SDK v2 for Python を使って取得できます。使用しているコンピューティングにライブラリ azure-ai-ml がインストールされていることを確認します。次の例では、ワークスペースに関連付けられている一意の MLFLow 追跡 URI を取得します。
1. MLClient を使ってワークスペースにログインします。これを行う簡単な方法は、ワークスペースの構成ファイルを使うことです。
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(credential=DefaultAzureCredential())
```
  ヒント
  
  ワークスペース構成ファイルは、次の方法でダウンロードできます。
  
  Azure ML スタジオに移動します
  
  ページの右上 -> [構成ファイルをダウンロードする] をクリックします。
  
  作業しているのと同じディレクトリにファイル config.json を保存します。
2. または、サブスクリプション ID、リソースグループ名、ワークスペース名を使って取得することもできます。
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your AzureML workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<WORKSPACE_NAME>'

ml_client = MLClient(credential=DefaultAzureCredential(),
                        subscription_id=subscription_id, 
                        resource_group_name=resource_group,
                        workspace_name=workspace_name)
```
  重要
  
  DefaultAzureCredential では、使用可能なコンテキストから資格情報のプルが試行されます。別の方法で資格情報を指定する場合 (たとえば、対話型の方法で Web ブラウザーを使用する場合)、InteractiveBrowserCredential または azure.identity パッケージで使用できるその他のメソッドを使用できます。
3. Azure Machine Learning 追跡 URI の取得:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Azure Machine Learning ポータルを使って、追跡 URI を取得します。
1. Azure Machine Learning スタジオポータルを開き、資格情報を使ってログインします。
2. 右上隅で、ワークスペースの名前をクリックして、[ディレクトリ + サブスクリプション + ワークスペース] ブレードを表示します。
3. [Azure portal ですべてのプロパティを表示する] をクリックします。
4. [要点] セクションで、プロパティ MLflow 追跡 URI が表示されます。
Azure Machine Learning Tracking URI は、サブスクリプション ID、リソースがデプロイされているリージョン、リソースグループ名、ワークスペース名を使って構築できます。次のコードサンプルは、その方法を示しています。

警告

プライベートリンク対応ワークスペースで作業している場合、MLflow エンドポイントもプライベートリンクを使って Azure Machine Learning と通信します。その結果、追跡 URI はここで提案されているものとは異なるものになります。そのような場合は、Azure ML SDK または CLI v2 を使って追跡 URI を取得する必要があります。
```
region = "<LOCATION>"
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<AML_WORKSPACE_NAME>'

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
追跡 URI の構成:
- MLFlow SDK の使用
- 環境変数の使用
次に、メソッド set_tracking_uri() では、MLflow 追跡 URI をその URI にポイントします。
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
MLflow の環境変数 MLFLOW_TRACKING_URI をコンピューティングに設定することで、そのコンピューティングでの MLflow とのやり取りが、既定で Azure Machine Learning を指すようにできます。
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
ヒント

Azure Databricks クラスターや Azure Synapse Analytics クラスターなどの共有環境で作業する場合は、クラスターレベルで環境変数 MLFLOW_TRACKING_URI を設定し、セッションごとに実行するのではなく、クラスターで実行されているすべてのセッションについて Azure Machine Learning を指すように MLflow 追跡 URI を自動的に構成すると便利です。

認証を構成する

追跡を構成したら、関連付けられているワークスペースに対して認証を行う方法も構成する必要があります。既定では、MLflow 用の Azure Machine Learning プラグインは、既定のブラウザーを開いて資格情報の入力を求める対話型認証を実行します。 Azure Machine Learning ワークスペースで MLflow の認証方法を構成するその他の方法については、「Azure Machine Learning 用に MLflow を構成する」の「認証を構成する」を参照してください。

セッションに接続されているユーザーがいる対話型ジョブの場合は、対話型認証を使用できるため、これ以上の操作は必要ありません。

警告

対話型ブラウザー認証では、資格情報の入力を求めるメッセージが表示されると、コードの実行がブロックされます。これは、トレーニングジョブなどの無人環境での認証には適したオプションではありません。他の認証モードを構成することをお勧めします。

無人実行が必要なシナリオでは、Azure Machine Learning と通信するようにサービスプリンシパルを構成する必要があります。

MLflow SDK
環境変数の使用

import os

os.environ["AZURE_TENANT_ID"] = "<AZURE_TENANT_ID>"
os.environ["AZURE_CLIENT_ID"] = "<AZURE_CLIENT_ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<AZURE_CLIENT_SECRET>"

export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"

ヒント

共有環境で作業する場合は、コンピューティングでこれらの環境変数を構成することをお勧めします。ベストプラクティスとして、可能な限り Azure Key Vault のインスタンスでシークレットとして管理します。たとえば、Azure Databricks では、クラスター構成で AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}} のようにして環境変数でシークレットを使用できます。 Azure Databricks で行う方法については、「環境変数でシークレットを参照する」を参照するか、お使いのプラットフォームで同様のドキュメントを参照してください。

Azure Machine Learning の実験名

既定では、Azure Machine Learning は Default と呼ばれる既定の実験で実行を追跡します。通常は、作業する実験を設定することをお勧めします。実験の名前を設定するには、次の構文を使用します。

mlflow.set_experiment(experiment_name="experiment-name")

パラメーター、メトリック、成果物の追跡

その後、今までと同じように Azure Synapse Analytics で MLflow を使用できます。詳細については、「メトリックのログと確認およびログファイル」を参照してください。

MLflow を使ってレジストリにモデルを登録する

モデルは、ライフサイクルを管理するための一元化されたリポジトリを提供する Azure Machine Learning ワークスペースに登録できます。次の例では、Spark MLLib でトレーニングされたモデルをログに記録し、レジストリに登録します。

mlflow.spark.log_model(model, 
                       artifact_path = "model", 
                       registered_model_name = "model_name")

名前付きの登録済みモデルが存在しない場合、メソッドにより新しいモデルが登録され、バージョン 1 が作成され、MLflow オブジェクト ModelVersion が返されます。
名前付きの登録済みモデルが既にある場合は、メソッドにより新しいモデルバージョンが作成され、バージョンオブジェクトが返されます。

MLflow を使用して、Azure Machine Learning に登録されたモデルを管理できます。詳細については、「MLflow を使用して Azure Machine Learning でモデルレジストリを管理する」を参照してください。

Azure Machine Learning に登録したモデルのデプロイと使用

MLflow を使って Azure Machine Learning サービスに登録したモデルは、次のように使用できます。

Azure Machine Learning のエンドポイント (リアルタイムとバッチ): このデプロイでは、Azure Container Instances (ACI)、Azure Kubernetes (AKS) またはマネージドエンドポイントでのリアルタイムとバッチの両方の推論で Azure Machine Learning デプロイの機能を活用できます。
MLFlow モデルオブジェクトまたは Pandas UDF。Azure Synapse Analytics ノートブックでのストリーミングまたはバッチパイプラインで使用できます。

Azure Machine Learning エンドポイントにモデルをデプロイする

azureml-mlflow プラグインを利用して、Azure Machine Learning ワークスペースにモデルをデプロイできます。モデルをさまざまなターゲットにデプロイする方法の完全な詳細については、MLflow モデルをデプロイする方法に関する記事を確認します。

重要

モデルをデプロイするには、Azure Machine Learning のレジストリに登録する必要があります。 Azure Machine Learning では、未登録のモデルをデプロイすることはサポートされていません。

UDF を使ったバッチスコアリングのためにモデルをデプロイする

バッチスコアリング用に Azure Synapse Analytics クラスターを選択できます。 MLflow モデルが読み込まれ、新しいデータをスコアリングする Spark Pandas UDF として使用されます。

from pyspark.sql.types import ArrayType, FloatType 

model_uri = "runs:/"+last_run_id+ {model_path} 

#Create a Spark UDF for the MLFlow model 
pyfunc_udf = mlflow.pyfunc.spark_udf(spark, model_uri) 

#Load Scoring Data into Spark Dataframe 
scoreDf = spark.table({table_name}).where({required_conditions}) 

#Make Prediction 
preds = (scoreDf 
           .withColumn('target_column_name', pyfunc_udf('Input_column1', 'Input_column2', ' Input_column3', …)) 
        ) 

display(preds)

リソースをクリーンアップする

お使いの Azure Synapse Analytics ワークスペースを残したいが、Azure Machine Learning ワークスペースが不要になった場合は、Azure Machine Learning ワークスペースを削除できます。ログに記録されたメトリックと成果物をワークスペースで使用する予定がない場合、それらを個別に削除する機能は現時点では用意されていません。代わりに、ストレージアカウントとワークスペースを含むリソースグループを削除すれば、課金は発生しません。

Azure Portal で、左端にある [リソースグループ] を選択します。
作成したリソースグループを一覧から選択します。
[リソースグループの削除] を選択します。
リソースグループ名を入力します。次に、 [削除] を選択します。

MLflow と Azure Machine Learning を使用した Azure Synapse Analytics ML 実験の追跡

前提条件

ライブラリのインストール

MLflow を使用して実験を追跡する

Azure Machine Learning に接続された MLflow を使用するようにノートブックを構成する

Azure Machine Learning の実験名

パラメーター、メトリック、成果物の追跡

MLflow を使ってレジストリにモデルを登録する

Azure Machine Learning に登録したモデルのデプロイと使用

Azure Machine Learning エンドポイントにモデルをデプロイする

UDF を使ったバッチスコアリングのためにモデルをデプロイする

リソースをクリーンアップする

次のステップ

その他のリソース

MLflow と Azure Machine Learning を使用した Azure Synapse Analytics ML 実験の追跡

前提条件

ライブラリのインストール

MLflow を使用して実験を追跡する

Azure Machine Learning に接続された MLflow を使用するようにノートブックを構成する

Azure Machine Learning の実験名

パラメーター、メトリック、成果物の追跡

MLflow を使ってレジストリにモデルを登録する

Azure Machine Learning に登録したモデルのデプロイと使用

Azure Machine Learning エンドポイントにモデルをデプロイする

UDF を使ったバッチ スコアリングのためにモデルをデプロイする

リソースをクリーンアップする

次のステップ

その他のリソース

UDF を使ったバッチスコアリングのためにモデルをデプロイする