探索 Python SDK

已完成

重要

目前有兩個版本的 Python SDK:第 1 版 (v1) 和第 2 版 (v2)。 對於任何新專案,您應該使用第 2 版,因此本單元中的內容僅涵蓋第 2 版。 深入了解在 v1 和 v2 之間決定

資料科學家可使用 Azure Machine Learning,來定型、追蹤和管理機器學習模型。 身為資料科學家,您大多數時候使用的是 Azure Machine Learning 工作區內用於機器學習工作負載的資產。

隨著大部分的資料科學家都熟悉 Python 後,Azure Machine Learning 提供軟體開發套件 (SDK),讓您可以使用 Python 與工作區互動。

適用於 Azure Machine Learning 的 Python SDK 是理想工具,可供資料科學家在任何 Python 環境中使用。 無論您是正常使用 Jupyter 筆記本、Visual Studio Code,都可以安裝 Python SDK 並連接到工作區。

探索 Python SDK

若要在 Python 環境中安裝 Python SDK,您需要 Python 3.7 或更新版本。 您可以使用 pip 安裝此套件:

pip install azure-ai-ml

注意

在 Azure Machine Learning 工作室中使用筆記本時,在使用 Python 3.10 或更新版本時,原本就已安裝新的 Python SDK。 您可以使用 Python SDK 第 2 版搭配舊版 Python,但必須先進行安裝。

連線到工作區

安裝 Python SDK 之後,您必須連線到工作區。 藉由連線,您會驗證環境以與工作區互動,以建立和管理資產和資源。

若要驗證,您需要三個必要參數值:

  • subscription_id:訂用帳戶識別碼。
  • resource_group:資源群組的名稱。
  • workspace_name:工作區的名稱。

接下來,您可以使用下列程式碼來定義驗證:

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)

定義驗證之後,您必須呼叫 MLClient,供環境連線到工作區。 您可以在工作區中建立或更新資產或資源的任何時候呼叫 MLClient

例如,建立新作業來定型模型時,您會連線到工作區:

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    experiment_name="train-model"
)

# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)

使用參考文件

若要有效率地使用 Python SDK,您必須使用參考文件。 在參考文件中,您會發現 Python SDK 內可用的所有可能類別、方法和參數。

MLClient 類別的參考文件包含可用來連線和與工作區互動的方法。 此外,其也會連結到各種實體的可能作業,例如如何列出工作區中現有的資料存放區。

參考文件也包含您可以與其互動之所有實體的類別清單。 例如,當您想要建立與 Azure Blob 儲存體或 Azure Data Lake Gen 2 連結的資料存放區時,則存在個別的類別。

從實體清單中選取類似 AmlCompute 的特定類別,即可找到更詳細的頁面,以了解如何使用類別及其接受的參數