設定 Azure Machine Learning 的 MLflow

發行項
03/27/2024

本文說明如何設定 MLflow 以連線到 Azure Machine Learning 工作區，進行追蹤、登錄和部署。

Azure Machine Learning 工作區與 MLflow 相容，這表示兩者可以作為 MLflow 伺服器，而不需要任何額外設定。每個工作區都有一個 MLflow 追蹤 URI，MLflow 可用其來連線到工作區。 Azure Machine Learning 工作區已設定為使用 MLflow，因此不需要額外的設定。

不過，如果您在 Azure Machine Learning 外部工作 (例如本機電腦、Azure Synapse Analytics 或 Azure Databricks)，則必須設定 MLflow 以指向工作區。

重要

在 Azure 計算 (Azure Machine Learning Notebooks、裝載在 Azure Machine Learning 計算執行個體上的 Jupyter Notebook，或 Azure Machine Learning 計算叢集上執行的作業) 上執行時，您不需要設定追蹤 URI。 系統會自動為您設定。

必要條件

若要遵循本教學課程，您需要具備下列必要條件：

安裝 MLflow SDK 套件 mlflow 和適用於 MLflow azureml-mlflow 的 Azure Machine Learning 外掛程式。
```
pip install mlflow azureml-mlflow
```
提示

您可使用 mlflow-skinny 套件，這是輕量型 MLflow 套件，沒有 SQL 儲存體、伺服器、UI 或資料科學相依性。如果使用者主要需要 MLflow 的追蹤和記錄功能，而不需匯入包含部署在內的完整功能套件，則建議使用 mlflow-skinny。
Azure Machine Learning 工作區。您可以遵循建立機器學習資源教學課程來建立一個工作區。
- 查看您在工作區中執行 MLflow 作業所需的存取權限。
如果您要執行遠端追蹤 (也就是追蹤在 Azure Machine Learning 外部執行的實驗)，請將 MLflow 設定為指向 Azure Machine Learning 工作區的追蹤 URI。如需如何將 MLflow 連線至工作區的詳細資訊，請參閱設定適用於 Azure Machine Learning 的 MLflow。

設定 MLflow 追蹤 URI

若要將 MLflow 連線到 Azure Machine Learning 工作區，您需要工作區的追蹤 URI。每個工作區都有自己的追蹤 URI，而且具有通訊協定 azureml://。

取得工作區的追蹤 URI：
- Azure CLI
- Python
- Studio
- 手動
適用於：Azure CLI ml 延伸模組 v2 (目前)
1. 登入和設定您的工作區：
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location> 
```
2. 您可以使用 az ml workspace 命令來取得追蹤 URI：
```
az ml workspace show --query mlflow_tracking_uri
```
適用於：Python SDK azure-ai-ml v2 (目前)

您可以使用適用於 Python 的 Azure Machine Learning SDK v2 來取得 Azure ML MLflow 追蹤 URI。確保您正在使用的計算中已安裝程式庫 azure-ai-ml。下列範例會取得與您工作區建立關聯的唯一 MLFLow 追蹤 URI。
1. 使用 MLClient 登入您的工作區。使用工作區設定檔可以更輕鬆地執行此動作：
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(credential=DefaultAzureCredential())
```
  提示
  
  您可以透過下列方式下載工作區設定檔：
  
  瀏覽至 Azure ML 工作室
  
  按一下頁面右上角 - >下載設定檔。
  
  將檔案 config.json 儲存在您正在使用的相同目錄中。
2. 或者，您可以使用訂用帳戶識別碼、資源群組名稱和工作區名稱來取得：
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your AzureML workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<WORKSPACE_NAME>'

ml_client = MLClient(credential=DefaultAzureCredential(),
                        subscription_id=subscription_id, 
                        resource_group_name=resource_group,
                        workspace_name=workspace_name)
```
  重要
  
  DefaultAzureCredential 會嘗試從可用的內容中提取認證。如果您想要以不同的方式指定認證 (例如以互動方式使用網頁瀏覽器)，您可以使用 InteractiveBrowserCredential 或 azure.identity 套件中可用的任何其他方法。
3. 取得 Azure Machine Learning 追蹤 URI：
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
使用 Azure Machine Learning 入口網站來取得追蹤 URI：
1. 開啟 Azure Machine Learning 工作室入口網站，並使用您的認證登入。
2. 在右上角按一下工作區的名稱以顯示 [目錄 + 訂用帳戶 + 工作區] 刀鋒視窗。
3. 按一下 [在 Azure 入口網站中檢視所有屬性]。
4. 在 [基本資訊] 區段上，您會發現屬性 MLflow 追蹤 URI。
您可以使用訂用帳戶識別碼、部署資源的區域、資源群組名稱和工作區名稱來建構 Azure Machine Learning 追蹤 URI。下列程式碼範例會示範如何：

警告

如果您在已啟用私人連結的工作區中工作，MLflow 端點也會使用私人連結來與 Azure Machine Learning 通訊。因此，追蹤 URI 看起來會與此處的建議有所不同。在這些情況下，您必須使用 Azure ML SDK 或 CLI v2 取得追蹤 URI。
```
region = "<LOCATION>"
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<AML_WORKSPACE_NAME>'

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
設定追蹤 URI：
- 使用 MLFlow SDK
- 使用環境變數
然後，此方法 set_tracking_uri() 會將 MLflow 追蹤 URI 指向該 URI。
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
您可以設定計算中的 MLflow 環境變數 MLFLOW_TRACKING_URI，讓該計算中與 MLflow 的任何互動預設指向 Azure Machine Learning。
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
提示

使用共用環境時，例如 Azure Databricks 叢集、Azure Synapse Analytics 叢集或類似環境，最好在叢集層級設定環境變數 MLFLOW_TRACKING_URI，以自動設定 MLflow 追蹤 URI，針對叢集中執行的所有工作階段指向 Azure Machine Learning，而不是針對每個工作階段執行。

設定驗證

設定追蹤之後，您也必須設定相關聯工作區的驗證方法。根據預設，MLflow 的 Azure Machine Learning 外掛程式會開啟預設瀏覽器來提示認證，以執行互動式驗證。

適用於 MLflow 的 Azure Machine Learning 外掛程式透過 azure-identity 套件支援數種驗證機制，該套件會安裝為外掛程式 azureml-mlflow 的相依性。下列驗證方法會逐一嘗試，直到其中一個成功為止：

環境：讀取透過環境變數指定的帳戶資訊，並使用其進行驗證。
受控識別：如果應用程式部署至已啟用受控識別的 Azure 主機，則會向其進行驗證。
Azure CLI：如果使用者透過 Azure CLI az login 命令登入，其會以該使用者身分進行驗證。
Azure PowerShell：如果使用者透過 Azure PowerShell 的 Connect-AzAccount 命令登入，其會以該使用者身分進行驗證。
互動式瀏覽器：透過預設瀏覽器以互動方式驗證使用者。

對於有使用者連線到工作階段的互動式作業，您可以依賴互動式驗證，因此不需要採取進一步的動作。

警告

互動式瀏覽器驗證會在提示輸入認證時封鎖程式碼執行。不適合在自動環境中進行驗證，例如定型作業。建議您設定其他驗證模式。

針對需要自動執行的案例，您必須設定服務主體以與 Azure Machine Learning 通訊。

MLflow SDK
使用環境變數

import os

os.environ["AZURE_TENANT_ID"] = "<AZURE_TENANT_ID>"
os.environ["AZURE_CLIENT_ID"] = "<AZURE_CLIENT_ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<AZURE_CLIENT_SECRET>"

export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"

提示

在共用環境上工作時，建議您在計算中設定這些環境變數。最佳做法是盡可能將其作為 Azure Key Vault 執行個體中的祕密加以管理。例如在 Azure Databricks 中，您可以在環境變數中使用祕密，如下的叢集設定所示：AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}。如需如何在 Azure Databricks 中執行這項操作，請參閱參考環境變數中的祕密，或參考平台中的類似文件。

如果您想要使用憑證而非祕密，可以將環境變數 AZURE_CLIENT_CERTIFICATE_PATH 設定為 PEM 或 PKCS12 憑證檔案的路徑 (包括私密金鑰)，並將 AZURE_CLIENT_CERTIFICATE_PASSWORD 設定為憑證檔案的密碼 (如果有的話)。

設定授權和權限等級

某些預設角色，例如 AzureML 資料科學家或參與者，已設定為在 Azure Machine Learning 工作區中執行 MLflow 作業。如果使用自訂角色，您需要下列權限：

若要使用 MLflow 追蹤：
- Microsoft.MachineLearningServices/workspaces/experiments/*
- Microsoft.MachineLearningServices/workspaces/jobs/*
若要使用 MLflow 模型登錄：
- Microsoft.MachineLearningServices/workspaces/models/*/*

若要了解如何將您建立的服務主體或使用者帳戶的存取權授與工作區，請參閱授與存取權。

針對驗證進行疑難排解

MLflow 會嘗試在第一個與服務互動的作業上向 Azure Machine Learning 進行驗證，例如 mlflow.set_experiment() 或 mlflow.start_run()。如果在程序中發現問題或非預期的驗證提示，您可以增加記錄層級，以取得錯誤的詳細資料：

import logging

logging.getLogger("azure").setLevel(logging.DEBUG)

設定實驗名稱 (選擇性)

所有 MLflow 執行皆會記錄到使用中的實驗。根據預設，執行會記錄到為您自動建立的實驗，名為 Default。您可以設定要進行追蹤的實驗。

提示

使用 Azure Machine Learning CLI v2 提交作業時，您可以使用作業 YAML 定義中的屬性 experiment_name 來設定實驗名稱。您不必在定型指令碼上設定。如需詳細資訊，請參閱 YAML：顯示名稱、實驗名稱、描述和標籤。

MLflow SDK
使用環境變數

使用 MLflow 命令 mlflow.set_experiment() 來設定實驗。

experiment_name = 'experiment_with_mlflow'
mlflow.set_experiment(experiment_name)

您也可以使用實驗名稱來設定其中一個 MLflow 環境變數 MLFLOW_EXPERIMENT_NAME or MLFLOW_EXPERIMENT_ID。

export MLFLOW_EXPERIMENT_NAME="experiment_with_mlflow"

非公用 Azure 雲端支援

MLflow 的 Azure Machine Learning 外掛程式預設會設定為使用全域 Azure 雲端。不過，您可以藉由設定環境變數 AZUREML_CURRENT_CLOUD 來設定正在使用的 Azure 雲端。

MLflow SDK
使用環境變數

import os

os.environ["AZUREML_CURRENT_CLOUD"] = "AzureChinaCloud"

export AZUREML_CURRENT_CLOUD="AzureChinaCloud"

可使用下列 Azure CLI 命令來識別您所使用的雲端：

az cloud list

目前雲端的值 IsActive 設定為 True。

下一步

現在您的環境已連線到 Azure Machine Learning 中的工作區，可供開始使用。

共用方式為