浏览 Python SDK
重要
目前,Python SDK 有两个版本:版本 1(v1)和版本 2(v2)。 对于任何新项目,应使用 v2,因此,本单元中的内容仅涵盖 v2。 详细了解 在 v1 和 v2之间做出决定。
数据科学家可以使用 Azure 机器学习来训练、跟踪和管理机器学习模型。 作为数据科学家,你主要使用 Azure 机器学习工作区中的资产来处理机器学习工作负载。
由于大多数数据科学家熟悉 Python,Azure 机器学习提供了一个软件开发工具包(SDK),以便可以使用 Python 与工作区进行交互。
适用于 Azure 机器学习的 Python SDK 是数据科学家的理想工具,可用于任何 Python 环境。 无论你通常使用 Jupyter 笔记本、Visual Studio Code,都可以安装 Python SDK 并连接到工作区。
安装 Python SDK
若要在 Python 环境中安装 Python SDK,需要 Python 3.7 或更高版本。 您可以通过 pip
来安装该程序包:
pip install azure-ai-ml
注意
在 Azure 机器学习工作室中使用笔记本时,如果使用 Python 3.10 或更高版本,新的 Python SDK 已预装。 可以将 Python SDK v2 与早期版本的 Python 配合使用,但必须先安装它。
连接到工作区
安装 Python SDK 后,需要连接到工作区。 通过连接,你将对环境进行身份验证,以便与工作区交互以创建和管理资产和资源。
若要进行身份验证,需要将值设置为三个必需的参数:
-
subscription_id
:订阅 ID。 -
resource_group
:资源组的名称。 -
workspace_name
:工作区的名称。
接下来,可以使用以下代码定义身份验证:
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
ml_client = MLClient(
DefaultAzureCredential(), subscription_id, resource_group, workspace
)
定义身份验证后,需要调用 MLClient
,让环境连接到工作区。 每当你想要在工作区中创建或更新资产或资源时,都会调用 MLClient
。
例如,要创建新作业来训练模型,您需要连接到工作区。
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
experiment_name="train-model"
)
# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)
使用参考文档
若要有效地使用 Python SDK,需要使用参考文档。 在参考文档中,你将找到 Python SDK 中提供的所有可能的类、方法和参数。
有关 MLClient
类的参考文档 包括可用于连接和与工作区交互的方法。 此外,它还链接到各种实体的可能操作,诸如如何列出工作区中的现有数据存储。
参考文档还包括 可以与之交互的所有实体的类列表。 例如,如果要创建链接到 Azure Blob 存储或 Azure Data Lake Gen 2 的数据存储,则需要不同的类。
通过从实体列表中选择特定类(如 AmlCompute
),可以找到有关如何使用该类及其接受 的参数的更详细页面。