探索 Python SDK
重要
目前有兩個版本的 Python SDK:第 1 版 (v1) 和第 2 版 (v2)。 對於任何新專案,您應該使用第 2 版,因此本單元中的內容僅涵蓋第 2 版。 深入了解在 v1 和 v2 之間決定。
資料科學家可使用 Azure Machine Learning,來定型、追蹤和管理機器學習模型。 身為資料科學家,您大多數時候使用的是 Azure Machine Learning 工作區內用於機器學習工作負載的資產。
隨著大部分的資料科學家都熟悉 Python 後,Azure Machine Learning 提供軟體開發套件 (SDK),讓您可以使用 Python 與工作區互動。
適用於 Azure Machine Learning 的 Python SDK 是理想工具,可供資料科學家在任何 Python 環境中使用。 無論您是正常使用 Jupyter 筆記本、Visual Studio Code,都可以安裝 Python SDK 並連接到工作區。
探索 Python SDK
若要在 Python 環境中安裝 Python SDK,您需要 Python 3.7 或更新版本。 您可以使用 pip
安裝此套件:
pip install azure-ai-ml
注意
在 Azure Machine Learning 工作室中使用筆記本時,在使用 Python 3.10 或更新版本時,原本就已安裝新的 Python SDK。 您可以使用 Python SDK 第 2 版搭配舊版 Python,但必須先進行安裝。
連線到工作區
安裝 Python SDK 之後,您必須連線到工作區。 藉由連線,您會驗證環境以與工作區互動,以建立和管理資產和資源。
若要驗證,您需要三個必要參數值:
subscription_id
:訂用帳戶識別碼。resource_group
:資源群組的名稱。workspace_name
:工作區的名稱。
接下來,您可以使用下列程式碼來定義驗證:
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
ml_client = MLClient(
DefaultAzureCredential(), subscription_id, resource_group, workspace
)
定義驗證之後,您必須呼叫 MLClient
,供環境連線到工作區。 您可以在工作區中建立或更新資產或資源的任何時候呼叫 MLClient
。
例如,建立新作業來定型模型時,您會連線到工作區:
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
experiment_name="train-model"
)
# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)
使用參考文件
若要有效率地使用 Python SDK,您必須使用參考文件。 在參考文件中,您會發現 Python SDK 內可用的所有可能類別、方法和參數。
MLClient
類別的參考文件包含可用來連線和與工作區互動的方法。 此外,其也會連結到各種實體的可能作業,例如如何列出工作區中現有的資料存放區。
參考文件也包含您可以與其互動之所有實體的類別清單。 例如,當您想要建立與 Azure Blob 儲存體或 Azure Data Lake Gen 2 連結的資料存放區時,則存在個別的類別。
從實體清單中選取類似 AmlCompute
的特定類別,即可找到更詳細的頁面,以了解如何使用類別及其接受的參數。